Está en la página 1de 145

ANLISIS DE DATOS EN

INGENIERA
6. RUEBA DE HIPOTESIS
Ing. Rodrigo Wadnipar, M. Sc.
09/08/2014 1
09/08/2014 2
6. PRUEBAS DE HIPOTESIS (6 HT, 4 HP)
6.1 Conceptos Generales (Pruebas de una y dos colas, valor P,
tipos de riesgo)
6.2 Prueba de hiptesis sobre la media de una poblacin
(Varianza conocida)
6.3 Prueba de hiptesis sobre la media de una poblacin
(Varianza desconocida)
6.4 Prueba de hiptesis sobre la varianza
6.5 Prueba de hiptesis sobre una proporcin binomial
6.6 Prueba de hiptesis para la diferencia en medias,
varianzas conocidas
6.7 Prueba de hiptesis para el cociente de dos varianzas
6.8 Prueba de hiptesis para la diferencia en medias,
varianzas conocidas
6.9 Valores P para las pruebas Z, t, Chi, F
6.10 Prueba de Bondad de Ajuste Chi Cuadrado
09/08/2014 3
3
Bibliografa
Statistics for Engineering and the Sciences.
Mendenhall William. Pearson Prentice-Hall, 2007.
Probabilidad y Estadstica para Ingeniera y Ciencias
Walpole, Ronald E., Myers, Raymond H., Myers,
Sharon L., YE, Keying.
Octava edicin
Editorial PEARSON Educacin.
Probabilidad y estadstica aplicadas a la
ingeniera. Montgomery, Douglas C. y George C.
Runger.
Editorial Limusa Wiley.

PRUEBA DE HIPOTESIS
2
2
2
1
2
2 1 2 1
, , , , ,
Pr
o
o
o p p X X p X
hiptesis de ueba

Lenguaje Error Tipo I
y Tipo II
Pruebas de 1
y 2 colas
09/08/2014 4
HIPTESIS ESTADSTICAS
A menudo, el problema al que se enfrenta el cientfico o el
ingeniero no es tanto la estimacin de un parmetro
poblacional, sino ms bien la formulacin de un
procedimiento de decisin que se base en los datos, el
cual ofrezca una conclusin acerca de algn sistema
cientfico.
Por ejemplo:
Un investigador mdico puede decidir, sobre la base
de evidencia experimental, si en los seres humanos
beber caf incrementa el riesgo de padecer cncer.
Un ingeniero quiz tenga que decidir sobre la base de
datos mustrales si hay una diferencia entre la precisin
de dos tipos de medidores.
Tal vez un socilogo desee reunir los datos
apropiados que le permitan decidir si el tipo sanguneo
de un individuo y el color de los ojos son variables
independientes.
09/08/2014 5
HIPTESIS ESTADSTICAS
En cada uno de esos casos, el cientfico, el
ingeniero o el socilogo postulan o
conjeturan algo acerca de un sistema.
Cada uno de ellos debe incluir el uso de datos
experimentales y la toma de decisiones
basadas en ellos.
De manera formal, en cada caso, la conjetura
se puede poner en forma de hiptesis
estadstica.
Los procedimientos que conducen a la
aceptacin o rechazo de hiptesis
estadsticas como stas, comprenden un rea
importante de la inferencia estadstica.

09/08/2014 6
HIPTESIS ESTADSTICAS
Una hiptesis estadstica es una aseveracin o conjetura
con respecto a una o ms poblaciones.
La estructura de la prueba de hiptesis se formular usando
el trmino hiptesis nula, el cual se refiere a cualquier
hiptesis que deseamos probar y se denota con H
0
.
El rechazo de H
0
conduce a la aceptacin de una hiptesis
alternativa, que se denota con H
1
.
A un proceso que lleva una decisin acerca de una hiptesis
particular se le llama prueba de hiptesis.
Probar la hiptesis implica tomar una muestra aleatoria,
calcular un estadstico de prueba de los datos mustrales, y
utilizar despus el estadstico de prueba para tomar una
decisin acerca de la hiptesis nula.

09/08/2014 7
09/08/2014 8
Siempre que vayamos a proponer una hiptesis estadstica, en
trminos de la hiptesis nula H
0
o de la alternativa H
1
,
debemos tener en cuenta las siguientes advertencias:
1. La hiptesis nula H
0
siempre se refiere a un valor especfico
del parmetro de la poblacin (como, por ejemplo, ), no al
estadstico muestral (como ).
2. La expresin de la hiptesis nula siempre contiene un signo
igual respecto al valor especificado del parmetro
poblacional. Por ejemplo, H
0
: = 36.
3. La expresin de la hiptesis alternativa nunca contiene un
signo igual respecto al valor especificado del parmetro
poblacional. Por ejemplo, H
1
siempre debe ser de la forma
H
1
: 36, H
1
: < 36 o H
1
: > 36.
HIPTESIS ESTADSTICAS (continuacin)
X
HIPTESIS ESTADSTICAS (continuacin)
La hiptesis nula, Ho se establecer usando el signo de
igualdad, es decir:
H
0
: u = u
0
Donde u representa el parmetro y u
0
representa un
valor para ese parmetro.
La hiptesis alternativa se puede plantear de tres
formas:
1. H
1
: u > u
0
(Prueba unilateral o de una cola)
2. H
1
: u < u
0
(Prueba unilateral o de una cola)
3. H
1
: u u
0
(Prueba bilateral o de dos colas)
A pesar de que H
0
se establece como una igualdad,
decisiones de no rechazo de H
0
implica que el
parmetro u podra ser cualquier valor definido por el
complemento de H
1

09/08/2014 9
Como plantear las hiptesis
HIPTESIS ESTADSTICAS (continuacin)
Para establecer H
1
tenemos en cuenta lo
siguiente:
1. Si se hace una afirmacin o pregunta que indique
una direccin (> o <), H
1
se establece en la misma
direccin.
2. Si se hace una afirmacin o pregunta que indique
una direccin compuesta( o ), H
1
se establece
en la direccin contraria.
3. Si se hace una afirmacin o pregunta que no
indique direccin, H
1
se establece con el signo .
09/08/2014 10
Como plantear la hipotesis alternativa
HIPTESIS ESTADSTICAS (continuacin)
Planteamiento de las hipotesis
As por ejemplo:
1. Una nueva vacuna para la gripe es efectiva en no ms
de un 80%:
H
o
: P = 0,8
H
1
: P > 0,8
2. Una nueva vacuna para la gripe es efectiva en por lo
menos un 80%:
H
o
: P = 0,8
H
1
: P < 0,8
3. Una nueva vacuna para la gripe es efectiva en un 80%:
H
o
: P = 0,8
H
1
: P 0,8
11
09/08/2014
09/08/2014 12
HIPTESIS ESTADSTICAS (continuacin)
Importancia de establecer adecuadamente las hiptesis
1. Afirmacin: Una nueva vacuna para la gripe es efectiva
en por lo menos un 80%:
Mal planteada
H
o
: P = 0,8
H
1
: P > 0,8
Si la decisin es rechazar H
o
; la afirmacin es vlida.
Si la decisin es no rechazar H
o
la afirmacin es vlida.
2. Afirmacin: Una nueva vacuna para la gripe es efectiva
en por lo menos un 80%:
Bien planteada
H
o
: P = 0,8
H
1
: P < 0,8
Si la decisin es rechazar H
o
; la afirmacin no es vlida.
Si la decisin es no rechazar H
o
la afirmacin es vlida.

09/08/2014 12
HIPTESIS ESTADSTICAS (continuacin)
El planteamiento formal de una hiptesis a menudo est
influido por la estructura de la probabilidad de una
conclusin errnea.
Si el cientfico se interesa en apoyar con fuerza una opinin,
desea llegar a la opinin en la forma del rechazo de una
hiptesis.
Ejemplo: Si un investigador mdico desea mostrar
evidencia slida a favor de la opinin de que beber caf
aumenta el riesgo de contraer cncer, la hiptesis a probar
debera tener la forma no hay aumento en el riesgo de
padecer cncer como consecuencia de beber caf. Como
resultado, la opinin se alcanza mediante un rechazo.
De manera similar, para apoyar la afirmacin de que un tipo
de medidor es ms preciso que otro, el ingeniero prueba la
hiptesis de que no hay diferencia en la precisin de los
dos tipos de medidor.
09/08/2014 13
PRUEBA DE UNA HIPTESIS ESTDISTICA
Ejemplo: Para ilustrar los conceptos que se utilizan al probar una hiptesis
estadstica acerca de una poblacin, considere lo siguiente. Se sabe que cierto
tipo de vacuna contra el resfriado tan slo es efectiva en 25% despus de un
perodo de dos aos. Para determinar si una vacuna nueva, y algo ms cara, es
superior al dar proteccin contra el mismo virus durante un perodo ms largo,
suponga que se eligen a 20 personas al azar y se inoculan. Si ms de 8 de quienes
reciben la nueva vacuna superan el lapso de dos aos sin contraer el virus, la
nueva vacuna se considerar superior a la que se usa en la actualidad. El requisito
de que el nmero exceda de 8 es algo arbitrario, aunque parece razonable, ya que
representa una ganancia modesta sobre las 5 personas que se esperara que
recibieran proteccin si las 20 personas se inocularon con la vacuna ya en uso. En
esencia probamos la hiptesis nula de que - despus de un perodo de dos aos
la nueva vacuna es igualmente eficaz que la que, por lo general, se utiliza ahora.
La hiptesis alternativa es que la nueva vacuna es de hecho superior, lo cual es
equivalente a probar la hiptesis de que el parmetro binomial para la
probabilidad de un xito sobre una prueba dada es p = contra la alternativa de
que p > . Esto por lo general se escribe como:
H
0
: p =
H
1
: p > 09/08/2014 14
PRUEBA DE UNA HIPTESIS ESTADSTICAS (continuacin)
ERRORES TIPO I y TIPO II
Un proceso de decisin utilizando pruebas de
hiptesis puede llevar a una de dos conclusiones
incorrectas, las cuales se conocen como error tipo I
y error tipo II.

El error tipo I se define como el rechazo de la
hiptesis nula H
o
cuando sta es verdadera. La
probabilidad de incurrir en este error se denota con la
letra griega o y se le llama nivel de significancia.

El error tipo II se define como la aceptacin de la
hiptesis nula cuando sta es falsa. La probabilidad
de incurrir en este error se denota con la letra |.

09/08/2014 15
HIPTESIS ESTADSTICAS (continuacin)
09/08/2014 16
Decisin sobre H
0
H
0
e verdadera H
0
es falsa
Decisin correcta Decisin incorrecta
Probabilidad = 1 - o Error Tipo II
1 - o se llama grado
de confianza
Probabilidad = |
Decisin incorrecta Decisin correcta
Error tipo I
Probabilidad = 1 - |
Probabilidad = o
o se llama nivel de
significancia
Tabla: Errores tipo I y II y sus correspondiente probabilidades
Aceptar H
0
1 - | se llama
potencia
Rechazar H
0
PRUEBA DE UNA HIPTESIS ESTADSTICAS (continuacin)
La probabilidad de cometer un error tipo I , tambin llamada nivel de
significancia, se denota por la letra griega . En el caso del ejemplo de las
vacunas, un error tipo I ocurrir cuando se rechace H
0
y ms de 8 individuos
superen el perodo de 2 aos sin contraer el virus, al usar la nueva vacuna que
en realidad equivale a la que est en uso. Por lo tanto, si X es el nmero de
individuos que permanecen libres del virus por al menos 2 aos,






Decimos que la hiptesis nula, p = 1/4 , se prueba al nivel de significancia
= 0,0409. A veces el nivel de significancia se llama tamao de la prueba. Una
regin crtica de tamao 0,0409 es muy pequea y, por lo tanto, es poco
probable que se cometa un error tipo I. En consecuencia, sera poco probable
que ms de 8 individuos permanecieran inmunes a un virus por un perodo de
ms de dos aos mediante el uso de una vacuna nueva, que en esencia es
equivalente a la que ahora existe en el mercado.



= =

=
= =
|
.
|

\
|
=
|
.
|

\
|
=
|
.
|

\
|
=
|
.
|

\
|
= > = =
8
0
8
0
20
9
0409 . 0 9591 . 0 1 1
4
1
, 20 ; 1
4
1
, 20 ;
4
1
8 ) (
x x
x n x
x
q p
x
n
x b
x b p cuando X P I tipo error P
o
o
09/08/2014 17
09/08/2014 18
Solucin:
n p
20 0,25
x f(x)
9 0,0271 x f(x)
10 0,0099 0 0,0032
11 0,0030 1 0,0211
12 0,0008 2 0,0669
13 0,0002 3 0,1339
14 0,0000 4 0,1897
15 0,0000 5 0,2023
16 0,0000 6 0,1686
17 0,0000 7 0,1124
18 0,0000 8 0,0609
19 0,0000 Total 2 0,9591
20 0,0000
Total 0,0409 1 - Total 2 0,0409


= =

=
= =
|
.
|

\
|
=
|
.
|

\
|
=
|
.
|

\
|
=
|
.
|

\
|
= > = =
8
0
8
0
20
9
0409 . 0 9591 . 0 1 1
4
1
, 20 ; 1
4
1
, 20 ;
4
1
8 ) (
x x
x n x
x
q p
x
n
x b
x b p cuando X P I tipo error P
o
o
PRUEBA DE UNA HIPTESIS ESTADSTICAS (continuacin)
La probabilidad de cometer un error tipo II, se denota por la letra griega .
Es imposible de calcular a menos que tengamos una hiptesis alternativa
especfica. Si probamos la hiptesis nula p = contra la hiptesis alternativa
p = , entonces seremos capaces de calcular la probabilidad de no rechazar
H
0
cuando es falsa. Simplemente encontramos la probabilidad de obtener 8 o
menos en el grupo que supera el perodo de dos aos cuando p = . En este
caso,







Esta es una probabilidad ms bien alta, que indica un procedimiento de
prueba donde es muy probable que rechacemos la nueva vacuna cuando, de
hecho, es superior a la que est en uso. Idealmente, preferimos utilizar un
procedimiento de prueba en el cual sean pequeas las probabilidades de los
errores tipo I y tipo II.
09/08/2014 19

= =

=
|
.
|

\
|
=
|
.
|

\
|
=
|
.
|

\
|
= s = =
8
0
8
0
. 2517 , 0
2
1
, 20 ;
2
1
8 ) (
x x
x n x
q p
x
n
x b
p cuando X P II tipo error P
|
|
09/08/2014 20
Solucin:
n p
20 0,5
x f(x)
0 0,0000
1 0,0000
2 0,0002
3 0,0011
4 0,0046
5 0,0148
6 0,0370
7 0,0739
8 0,1201
Total 0,2517

= =

=
|
.
|

\
|
=
|
.
|

\
|
=
|
.
|

\
|
= s = =
8
0
8
0
. 2517 , 0
2
1
, 20 ;
2
1
8 ) (
x x
x n x
q p
x
n
x b
p cuando X P II tipo error P
|
|
PRUEBA DE UNA HIPTESIS ESTADSTICAS (continuacin)
Es posible que el director del programa de prueba est
dispuesto a cometer un error tipo II, si la vacuna ms cara no es
significativamente superior. De hecho, la nica ocasin en que
desea estar prevenido contra un error tipo II es cuando el valor
real de p es al menos 0,7. Si p = 0,7 este procedimiento de
prueba da




Con una probabilidad tan pequea de cometer un error tipo II,
es bastante improbable que se rechace la nueva vacuna cuando
tiene una efectividad del 70% despus de un perodo de dos
aos. Conforme la hiptesis alternativa se aproxima a la unidad,
el valor de tiende a cero.
09/08/2014 21
( )
( )

= =

=
|
.
|

\
|
= =
= s = =
8
0
8
0
. 0051 , 0 7 . 0 , 20 ;
7 , 0 8 ) (
x x
x n x
q p
x
n
x b
p cuando X P II tipo error P
|
|
09/08/2014 22
Solucin:
n p
20 0,7
x f(x)
0 0,0000
1 0,0000
2 0,0000
3 0,0000
4 0,0000
5 0,0000
6 0,0002
7 0,0010
8 0,0039
Total 0,0051
( )
( )

= =

=
|
.
|

\
|
= =
= s = =
8
0
8
0
. 0051 , 0 7 . 0 , 20 ;
7 , 0 8 ) (
x x
x n x
q p
x
n
x b
p cuando X P II tipo error P
|
|
EVALUACIN DE LOS ERRORES
Ejemplo
Un fabricante desarrolla un nuevo sedal para pesca
que, segn afirma, tiene una resistencia media a la
rotura de 15 kg con una desviacin estndar de 0,5 kg .
Para probar la hipotesis que = 15 kg contra la
alternativa de que < 15 kg; se prueba una muestra
aleatoria de 50 sedales, el fabricante considera crtico
encontrar un x < 14,9
1. Encuentre la probabilidad de cometer error tipo I.
2. Encuentre la probabilidad de cometer error tipo II para
la alternativa = 14,7 kg
09/08/2014
23
EVALUACIN DE LOS ERRORES (continuacin)
09/08/2014 24
Solucin al ejemplo
29
Relacin entre los tipos de errores
Ejemplo

09/08/2014 25
Relacin entre los tipos de errores (continuacin)
Ejemplo
09/08/2014 26
Relacin entre los tipos de errores (continuacin)
Ejemplo
3. El aumento en el tamao de la muestra n
reducir a o y a |.
Si en el ejercicio se aumenta n a 100 bajo
las condiciones inciales, se tiene que:



o pas de 0,0786 a 0,02275 y | pas de
0,00234 a 0,000032
09/08/2014 27
( )
( ) 000032 , 0 999968 , 0 1 7 , 14 | 9 , 14
02275 , 0 15 | 9 , 14
= = = > =
= = < =
|
o
X P
X P
Relacin entre los tipos de errores (continuacin)
Ejemplo
4. Si la hiptesis nula es falsa, | ser menor
cuando la distancia entre el valor real y el valor
hipottico sea ms grande, n = 100.
Del ejercicio se tiene:

Si se cambia la alternativa especfica a = 14,8
se tiene
09/08/2014 28
( ) 000032 , 0 7 , 14 | 9 , 14 = = > = | X P
( ) 022750 , 0 8 , 14 | 9 , 14 = = > = | X P
POTENCIA DE UNA PRUEBA ESTADSTICA
La potencia de una prueba estadstica es la
probabilidad de rechazar la hiptesis nula H
o
cuando la
hiptesis alternativa es verdadera, es decir la
probabilidad de rechazar correctamente una hiptesis
nula falsa. La potencia se calcula como: 1 | = P
(Rechazar H
0
|H
0
es falsa)
El valor P es el nivel de significacin ms bajo que
llevara al rechazo de la hiptesis nula H
o
con los datos
dados.
La potencia es una medida de sensibilidad de la prueba
para detectar diferencias entre el valor real del
parmetro y el valor hipottico, para el ejemplo
realizado la potencia de la prueba ser
1 - | = 1- 0,0023 = 0,9977 es decir se rechazar H
o
en
forma adecuada el 99,77% de las veces.
09/08/2014
29
24
PASOS PARA ESTABLECER UNA PRUEBA DE HIPTESIS
Paso1



Paso2

Paso3

09/08/2014 30
PASOS PARA ESTABLECER UNA PRUEBA DE HIPTESIS
Paso 4



Paso 5



09/08/2014 31
Pasos para realizar una prueba de hipotesis (Paso 5)
Utilizacin de la regin crtica


09/08/2014 32
Pasos para realizar una prueba de
hipotesis (Paso 5)
Decisin

09/08/2014 33
Pasos para realizar una prueba de
hipotesis (Paso 5)
Utilizando el valor de P



Qu es el valor de P?


Cmo calcular el valor de P?

09/08/2014 34
Pasos para realizar una prueba de hipotesis (Paso 5)
Decisin

09/08/2014 35
57 58
Ejemplo 1 (Media y varianza)
(Utilice un nivel de significancia de 0.05)

09/08/2014 36
09/08/2014 37
Ejemplo 2 (Proporcin, muestras grandes)
(Utilice un nivel de significancia de 0.05)
09/08/2014 38
Ejemplo 3 (Proporcin muestras pequeas)
(Utilice un nivel de significancia de 0.05)
09/08/2014 39
Ejemplo 4 (Cociente de varianzas y Diferencia de
Medias, Muestras Independientes)
(Utilice un nivel de significancia de 0.05)
09/08/2014 40
Ejemplo 5 (Diferencia de Medias, Muestras
dependientes)
(Utilice un nivel de significancia de 0.05)
09/08/2014 41
Ejemplo 6 (Diferencia de proporciones,
Proporciones iguales)
(Utilice un nivel de significancia de 0.05)
09/08/2014 42
Ejemplo 7 (Diferencia de proporciones, Diferencia
diferente de cero)
(Utilice un nivel de significancia de 0.05)
HIPTESIS ESTADSTICAS (continuacin)
Prueba de hiptesis de una y dos colas
Suponga que se tiene inters en la rapidez de combustin del
propulsor slido utilizado para impulsar los sistemas de expulsin de la
tripulacin de un avin. Entonces, la rapidez de combustin es una
variable aleatoria que puede describirse con una distribucin de
probabilidad. Suponga que el inters se enfoca en la media de la rapidez
de combustin (uno de los parmetros de esta distribucin).
Especficamente, quiere decidirse si la media de la rapidez de
combustin es 50 cm/s o no. Esto puede expresarse formalmente como:
H
0
: = 50 cm/s
H
1
: 50 cm/s
Al enunciado H
0
: = 50 cm/s se le llama hiptesis nula, y al
enunciado H
1
: 50 cm/s se le llama hiptesis alternativa.
Como la hiptesis alternativa especifica el valor de que podra ser
mayor o bien menor que 50 cm/s, se llama hiptesis alternativa de dos
colas.
Una hiptesis alternativa de una cola se expresa as:
H
0
: = 50 cm/s H
0
: = 50 cm/s
H
1
: < 50 cm/s H
1
: > 50 cm/s


09/08/2014 43
Ejemplo 10.1 W: Un fabricante de cierta marca de cereal de arroz
afirma que el contenido promedio de grasa saturada no excede de
1.5 gramos. Establezca la hiptesis nula y alternativa a utilizar para
probar esta afirmacin y determine donde se localiza la regin
crtica.
Solucin: la afirmacin del fabricante se debera rechazar solo si
es mayor que 1.5 mgr y no se debera rechazar si es menor o igual
que 1.5 mgr. Entonces, probamos


De manera que el no rechazo de H
0
no descarta valores menores
que 1.5 mgr. Como tenemos una prueba de una cola, el smbolo
mayor indica que la regin crtica yace por completo en la cola
derecha de la distribucin de nuestro estadstico de prueba .

, 5 . 1 :
, 5 . 1 :
1
0
>
=

H
H
HIPTESIS ESTADSTICAS (continuacin)
Prueba de hiptesis de una y dos colas
X
09/08/2014
44
HIPTESIS ESTADSTICAS (continuacin)
Prueba de hiptesis de una y dos colas

Ejemplo 10.2 W: Un agente de bienes races afirma que el 60% de todas las
viviendas privadas que se construyen actualmente son casa con tres
dormitorios. Para probar esta afirmacin, se inspecciona una muestra grande
de viviendas nuevas. La proporcin con tales casas con 3 dormitorios se registra
y se utiliza como estadstico de la prueba. Establezca la hiptesis nula y la
hiptesis alternativa a utilizarse en esta prueba y determine la posicin de la
regin crtica.
Solucin: si el estadstico de prueba fuera considerablemente mayor o menor
que p = 0.6, rechazaramos la afirmacin del agente, por lo que deberamos
establecer la hiptesis



La hiptesis alternativa implica una prueba de dos colas con la regin crtica
dividida por igual en ambas colas de la distribucin de , nuestro estadstico de
prueba.
, 6 . 0 :
, 6 . 0 :
1
0
=
=
p H
p H
.
P
09/08/2014 45
HIPTESIS ESTADSTICAS (continuacin)
En el problema de la rapidez de combustin, suponga que se prueba
una muestra de n = 10 observaciones y se obtiene la media muestral
de la rapidez de combustin. La media muestral es una estimacin de la
verdadera media poblacional . Un valor de la media muestral que est
cerca del valor hipottico = 50 cm/s es evidencia de que la verdadera
media es en realidad 50 cm/s; es decir, dicha evidencia apoya la
hiptesis nula H
0
. Por otra parte, una media muestral que difiera
considerablemente de 50 cm/s es evidencia a favor de la hiptesis
alternativa H
1
. Por tanto, en este caso la media muestral es el estadstico
de la prueba.
La media muestral puede tomar muchos valores diferentes. Suponga que
si 48.5 51.5, no se rechazar la hiptesis nula H
0
: = 50, y cuando
< 48.5 o bien > 51.5, se rechazar la hiptesis nula a favor de
la hiptesis alternativa H
1
: 50. Ver siguiente figura:
X
X
X X
X
Se rechaza H
0
No se rechaza H
0
Se rechaza H
0

50 cm/s = 50 cm/s 50 cm/s
48.5 = 50 51.5
Criterios de decisin para probar H
0
: =50 cm/s contra H
1
: 50 cm/s.
09/08/2014 46
HIPTESIS ESTADSTICAS (continuacin)
En el problema de la rapidez de combustin de la carga propulsora, ocurrir un
error tipo I cuando x > 51.5 o cuando x < 48.5, dado que la verdadera media de la
rapidez de combustin es = 50 cm/s.
Suponga que la desviacin estndar de la rapidez de combustin es =2.5 cm/s
y que la rapidez de combustin tiene una distribucin para la que se cumplen las
condiciones del teorema del lmite central.
Entonces la distribucin de la media muestral es aproximadamente normal con
media = 50 y desviacin estndar . La probabilidad de
incurrir en un error tipo I es igual a la suma de las reas que se han sombreado en
las colas de la distribucin normal que se muestra en la siguiente figura. Esta
probabilidad puede encontrarse como:

Los valores z que corresponden a los valores crticos 48.5 y 51.5 son


Por lo tanto
Esto implica que 5.74% de todas las muestras
aleatorias llevaran al rechazo de la hiptesis
H
0
: = 50 cm/s cuando la verdadera
media de la rapidez de combustin es
en realidad 50 cm/s.

79 . 0 10 / 5 . 2 / = = n o
) 50 5 . 51 ( ) 50 5 . 48 ( = > + = < = o cuando X P cuando X P
90 . 1
79 . 0
50 5 . 51
90 . 1
79 . 0
50 5 . 48
2 1
=

= =

= z z
( ) ( ) 0574 . 0 0287 . 0 0287 . 0 90 . 1 90 . 1 = + = > + < = Z P Z P o
09/08/2014
47
HIPTESIS ESTADSTICAS (continuacin)
Al examinar la anterior figura se observa que puede reducirse
ampliando la regin de aceptacin. Por ejemplo, si los valores crticos se
hacen 48 y 52, el valor de es




Tambin podra reducirse incrementando el tamao de la muestra. Si
n = 16, entonces y al utilizar la regin crtica
original del problema, se encuentra

0164 . 0 0082 . 0 0082 . 0
) 40 . 2 ( ) 40 . 2 (
625 . 0
50 5 . 51
625 . 0
50 5 . 48
= + =
> + < =
|
.
|

\
|

> +
|
.
|

\
|

< =
o
o Z P Z P Z P Z P
, 625 . 0 16 / 5 . 2 / = = n o
40 . 2
625 . 0
50 5 . 51
40 . 2
625 . 0
50 5 . 48
2 1
=

= =

= z z
0114 . 0 0057 . 0 0057 . 0
) 53 . 2 ( ) 53 . 2 (
79 . 0
50 52
79 . 0
50 48
= + =
> + < =
|
.
|

\
|

> +
|
.
|

\
|

< =
o
o Z P Z P Z P Z P
09/08/2014 48
HIPTESIS ESTADSTICAS (continuacin)
Al evaluar un procedimiento de prueba de hiptesis, tambin es importante
examinar la probabilidad de un error tipo II, la cual se denotar por . Es decir
| = P(error tipo II) = P(no puede rechazarse H
0
cuando H
0
es falsa)
Suponga que es importante rechazar la hiptesis nula H
0
: = 50 siempre que la
rapidez de combustin media se mayor de 52 cm/s o menor que 48 cm/s. Podra
calcularse la probabilidad del error tipo II para los valores = 52 y = 48, y usar
este resultado para tener una idea de cual sera el desempeo del procedimiento
de prueba.
Especficamente, cmo funcionara el procedimiento de prueba si se desea
detectar, es decir, rechazar H
0
para un valor de la media = 52 o = 48? Debido
a la simetra, solo es necesario evaluar uno de los dos casos, por ejemplo,
encontrar la probabilidad de aceptar la hiptesis nula H
0
: = 50 cuando la
verdadera media es = 52 cm/s.
Se incurrir en un error tipo II si la media
muestral est entre 48.5 y 51.5 cuando
= 52. Como se ve en la figura, esta es
simplemente la probabilidad de que
48.5 51.5, cuando la verdadera media
es = 52 o el rea sombreada bajo la
distribucin normal de la derecha.
X
X
09/08/2014 49
HIPTESIS ESTADSTICAS (continuacin)

= P(48.5 51.5 cuando = 52)

Los valores z correspondientes a 48.5 y 51.5 cuando = 52 son




Por lo tanto





Luego si se est probando H
0
: = 50 contra H
1
: 50 con n = 10, y el
verdadero valor de la media = 52, la probabilidad de que no pueda
rechazarse la hiptesis nula falsa es 0.2643. Por simetra, el verdadero
valor de la media = 48, el valor de tambin ser 0.2643.
X
63 . 0
79 . 0
52 5 . 51
43 . 4
79 . 0
52 5 . 48
2 1
=

= =

= z z
2643 . 0 0000 . 0 2643 . 0
) 43 . 4 ( ) 63 . 0 ( ) 63 . 0 43 . 4 (
= =
s s = s s =
|
| Z P Z P Z P
09/08/2014 50
HIPTESIS ESTADSTICAS (continuacin)
La probabilidad de incurrir en un error tipo II aumenta con rapidez con
forme el verdadero valor de se aproxima al valor propuesto en la
hiptesis. En la siguiente figura, donde el verdadero valor de = 50.5 y el
valor propuesto de la hiptesis es H
0
: = 50. El verdadero valor de est
muy cerca de 50, y el valor de es
= P(48.5 51.5 cuando = 50.5)

X
09/08/2014 51
HIPTESIS ESTADSTICAS (continuacin)
Fig. 9-5
09/08/2014 52
HIPTESIS ESTADSTICAS (continuacin)
09/08/2014 53
1. The size of the critical region, and consequently the
probability of a type I error , can always be reduced by
appropriate selection of the critical values.
2. Type I and type II errors are related. A decrease in
the probability of one type of error always results in an
increase in the probability of the other, provided that the
sample size n does not change.
3. An increase in sample size will generally reduce both
and, provided that the critical values are held constant.
4. When the null hypothesis is false, increases as the
true value of the parameter approaches the value
hypothesized in the null hypothesis. The value of
decreases as the difference between the true mean and
the hypothesized value increases.
HIPTESIS ESTADSTICAS (continuacin)
09/08/2014 54
Inferencia sobre la media de una poblacin, varianza conocida
n
X
Z
o
o
o

=
Como se supone que la poblacin cumple las condiciones del
teorema del lmite central, se utiliza el siguiente estadstico de
prueba:
H
o
deber rechazarse si o , si la hiptesis
es de dos colas y o si la hiptesis es de una
cola, para H
1
: >
0
y H
1
: <
0
respectivamente.
2 o
z Z
o
>
2 o
z Z
o
<
o
z Z
o
>
o
z Z
o
<
Frmulas para el tamao de muestra para o, | y o dados.
Para hiptesis alternativa de dos colas
( )
2
2
2
2
o
o
| o
+
~
z z
n
Para hiptesis alternativa de una cola
( )
2
2
2
o
o
| o
+
=
z z
n
donde .
o
o =
09/08/2014 55
57
58
Inferencia sobre la media de una poblacin, varianza conocida
(continuacin)
09/08/2014 56
Inferencia sobre la media de una poblacin, varianza conocida
(continuacin)
P
0 2.02
Z
09/08/2014 57
0
0
55
o
35
57
55
-2.83 0 2.83
Inferencia sobre la media de una poblacin, varianza conocida
(continuacin)
P/2 P/2
09/08/2014
58
0
0
55
35
55
o o
Inferencia sobre la media de una poblacin, varianza conocida (con)
Cuando se hacen clculos del tamao de la muestra o del
error tipo II, en ocasiones es ms conveniente utilizar las
curvas de operacin caracterstica.
En estas curvas se grfica | contra un parmetro d para
varios tamaos de muestra n.
El parmetro d se define como:
Intervalos de confianza
o
o
o

=

=
0
d
El intervalo de confianza del 100(1 o) por ciento para
est dado por
n z x n z x o o
o o
+ s s
2 2
09/08/2014 59
Inferencia sobre la media de una poblacin, varianza conocida (con)
Z = Estadstico normal estndar para cierto o.
k = desviacin absoluta mxima permitida sobre la
media de la distribucin.
o = desviacin estndar de la distribucin.
Otra forma de calcular el tamao de muestra:
2
2
|
|
.
|

\
|

=
k
z
n
o
o
Donde:
09/08/2014 60
Inferencia sobre la media de una poblacin, varianza desconocida
Estadstico de prueba:
- H
o
deber rechazarse si , si la hiptesis es de dos
colas y o si la hiptesis es de una cola.
n s
x
t
o
0

=
1 , 2
>
n o
t t
o
1 ,
>
n o
t t
o
1 ,
<
n o
t t
o
Intervalos de confianza
- El intervalo de confianza del 100(1 o) por ciento para est
dado por
n s t x n s t x
n n
+ s s
1 , 2 1 , 2 o o

09/08/2014 61
Inferencia sobre la media de una poblacin, varianza desconocida
Ejemplo: Se desea determinar si el contenido promedio de los
envases de un lubricante especfico es de 10 litros, si los
contenidos de una muestra aleatoria de 10 envases son:
litros.
Utilice un nivel de significancia o de 0,01 y suponga que los
contenidos se ajustan a una distribucin normal.
Solucin:
09/08/2014 62
10,2 9,7 10,1 10,3 10,1 9,8 9,9 10,4 10,3 9,8
Inferencia sobre la media de una poblacin, varianza desconocida
09/08/2014 63
0
o = 0,01
= 10
10,2 t = 0,772
9,7 P= 0,46
10,1 P= 0,46
10,3
10,1 9,81 <= <= 10,31
9,8
9,9
10,4
10,3
9,8
10,06 promedio
0,2459 desv esta
9.81 10.31
09/08/2014
64
Regin Crtica
Valor de P
1 , 2
>
n o
t t
o
H
o
deber rechazarse si , si la hiptesis es de dos colas y
o si la hiptesis es de una cola.
1 ,
>
n o
t t
o
1 ,
<
n o
t t
o
Valor de t
75
Inferencia sobre la media de una poblacin, varianza conocida y
desconocida
09/08/2014 65
Inferencia sobre la media de una poblacin, varianza conocida (con)
- t = Estadstico de la distribucin t student.
- k = desviacin absoluta mxima permitida sobre la media de la
distribucin.
- s = estimador de la desviacin estndar de la distribucin.
Clculo del tamao de muestra:
Cuando la media y la varianza se obtuvieron de una poblacin n
1

de 30 o menos elementos, entonces el clculo ptimo del tamao
de muestra viene dado por la siguiente frmula:
Donde:
2
2 , 1
1
|
|
.
|

\
|

=

k
t s
n
n o
09/08/2014 66
PRUEBA DE HIPTESIS PRUEBA PARA LA MEDIA - CASO DE
MUESTRAS GRANDES
09/08/2014 67
PRUEBA DE HIPTESIS PRUEBA PARA LA MEDIA - CASO DE
MUESTRAS GRANDES (continuacin)
3.3
09/08/2014 68
=
=
10.5 W. El Instituto Elctrico Edinson publica
cifras del nmero anual de kw-h que gastan
varios aparatos electrodomsticos. Se afirma que
una aspiradora gasta un promedio de 46kw-h al
ao. Si una muestra aleatoria de 12 hogares que
se incluye en un estudio planeado indica que las
aspiradoras gastan un promedio de 42kw-h al
ao con una desviacin estndar de 11.9kw-h,
en un nivel de significancia de 0.05 esto sugiere
que las aspiradoras gastan, en promedio, menos
de 46kw-h anualmente? suponga que la
poblacin de kw-h es normal.
09/08/2014 69
09/08/2014 70
Solucin:
DOS MUESTRAS: PRUEBA SOBRE DOS MEDIAS
Estas pruebas representan un conjunto de herramientas
analticas muy importantes para el cientfico o el
ingeniero.
Se extraen dos muestras aleatorias independientes de
tamao n
1
y n
2
, respectivamente de dos poblaciones con
media
1
y
2
, y varianzas conocidas o
2
1
y o
2
2
. Se sabe
que la variable aleatoria


Si las varianzas son conocidas e iguales, o
1
= o
2
=

o el
estadstico anterior se reduce a:

09/08/2014 71
( ) ( )
2 1
2 1 1
/ 1 / 1
2
n n
X X
Z
+

=
o

DOS MUESTRAS: PRUEBA SOBRE DOS MEDIAS (continuacin)
Los dos estadsticos anteriores sirves como base
para el desarrollo de los procedimientos de
prueba que incluyen dos medias.
La hiptesis bilateral sobre dos medias se escribe
con bastante generalidad como
H
0
:
1

2
= d
0
La H
1
puede ser bilateral o unilateral.
El estadstico de prueba est dado por:
09/08/2014 72
( )
2
2
2
1
1
2
0 2 1
/ / n n
d X X
Z
o o +

=
DOS MUESTRAS: PRUEBA SOBRE DOS MEDIAS (continuacin)
VARIANZAS DESCONOCIDAS PERO IGUALES
Las situaciones que ms prevalecen que implican
pruebas sobre dos medias son aquellas con
varianzas desconocidas
El estadstico de prueba es:
Donde S
2
p
est dado por:


Se incluye la distribucin t y no se rechaza la
hiptesis bilateral cuando:
09/08/2014 73
2 - n n /2, 2 - n n /2,
2 1 2 1
t t -
+ +
< <
o o
t
t
10.6 W. Se lleva a cabo un experimento para comparar el
desgaste por abrasivos de dos diferentes materiales
laminados. Se prueban 12 piezas del material uno,
exponiendo cada pieza a una mquina para medir el
desgaste. Se prueban 10 piezas del material 2 de manera
similar. En cada caso se observa la profundidad del
desgaste. Las muestras del material 1 dan un desgaste
promedio (codificado) de 85 unidades con una desviacin
estndar de 4; en tanto las muestras de material 2 dan un
promedio de 81 y una desviacin estndar de 5.
Podramos concluir con un nivel de significancia de 0.05
que el desgaste abrasivo del material 1 excede el del
material 2 en 2 unidades? Suponga que las poblaciones
son aproximadamente normales con varianzas iguales.
09/08/2014 74
09/08/2014 75
Solucin:
0
t
0
Ya que -2,086 <= t
0
=1,043 <= 2,086 no rechazar H
0
t
0.05,20
= 2,086
64
1.-Cuando las muestras a probar involucran a ms de 30
observaciones.


Ejemplo:
La altura promedio de 50 palmas que tomaron parte de un ensayo es
de 78 cm. con una desviacin estndar de 2.5 cm.; mientras que otras
50 palmas que no forman parte del ensayo tienen media y desviacin
estndar igual a 77.3 y 2.8 cm.



Se desea probar la hiptesis de que las palmas que participan en el
ensayo son ms altas que las otras.
Consultando el valor z de la tabla a 95% de probabilidad se tiene que
es 1.96, y dado que el valor z calculado no fue mayor al valor de la
tabla, entonces se declara la prueba no significativa.
Conclusin: Las alturas promedio de los 2 grupos de palmas son iguales
y la pequea diferencia observada en favor al primer grupo se debe al
azar.
09/08/2014
76
b
b
a
a
b a
n
S
n
S
X X
Zc
2 2
+

=
2.-Caso de nmero igual de observaciones y varianzas homogneas.
Ejemplo:
Se plant cierto experimento en 24 parcelas para probar
el efecto de la presencia o ausencia de K en el rendimiento de palma. Peso
medio del racimo (Kg.); o = 0.05.

n a b a
2
b
2
1 20,0 24,0 400,00 576,00
2 24,0 28,0 576,00 784,00
3 21,0 25,0 441,00 625,00
4 22,0 25,0 484,00 625,00
5 23,0 27,0 529,00 729,00
6 24,0 27,5 576,00 756,25
7 22,5 28,0 506,25 784,00
8 22,0 26,0 484,00 676,00
9 21,5 26,0 462,25 676,00
10 20,0 24,5 400,00 600,25
11 22,0 26,5 484,00 702,25
12 24,0 28,5 576,00 812,25
Suma 266,0 316,0 5918,50 8346,00
Promedio y
Varianza
22.16 26.33 2,02 2,24
Se busca en la tabla de t de student
con 2 (n-1) grados de libertad o sea
22, y se encuentra que el valor
tabular es de 2.074 al 95% de
probabilidad, el cual es menor que
la t calculada y por lo tanto se
declara la prueba significativa.
Conclusin: La diferencia entre
promedios observados es atribuible
al efecto de tratamiento (K), por
haberse conseguido un resultado
significativo.
09/08/2014
77
n
S S
X X
t
b a
b a
c
2 2
+

=
00 , 7
12
16 , 22 33 , 26
2 2
=
+

=
a b
S S
tc
3.-Caso de igual nmero de observaciones y varianzas heterogneas.


Ejemplo:
Se plant cierto experimento en 24 parcelas con dos clases de semillas: semilla
mezclada y semilla DxP seleccionada. Se desea saber si el rendimiento observado
por la semilla seleccionada difiere a la otra; o = 0.05.
Produccin de palma: TM/ha/ao

Semilla Semilla
mezclada Seleccionada
1 10,0 18,0 100,00 324,00
2 13,5 14,2 182,25 201,64
3 12,4 22,5 153,76 506,25
4 11,3 13,0 127,69 169,00
5 12,8 15,0 163,84 225,00
6 12,0 16,5 144,00 272,25
7 11,5 19,5 132,25 380,25
8 12,5 17,0 156,25 289,00
9 12,4 19,5 153,76 380,25
10 11,6 21,0 134,56 441,00
11 12,0 22,5 144,00 506,25
12 12,5 17,5 156,25 306,25
Sumas 144,5 216,2 20880,25 46742,44
Promedio y
Varianza
12,04 18,02 0,78 9,63
n a
2
b
2
Consultando la tabla de t con n-1 grados
de libertad (22) se encuentra un valor
de 2.074, por lo tanto, la diferencia se
declara significativa.
Conclusin: El rendimiento observado
por las plantas de semilla seleccionada
fue significativamente superior a las
otras.
09/08/2014 78
42 . 6
12
78 . 0
12
63 . 9
04 . 12 02 . 18
=
+

=
c
t
4.-Caso de diferente nmero de observaciones y varianzas homogneas


Ejemplo:
Se tom una rea de terreno distribuida en 22 parcelas y a 13 de ellas se les
aplic un fertilizante nitrogenado para medir el efecto del N en el crecimiento.
rea foliar de la hoja # 17 en m
2




n Con N (a) Sin N (b)
a
2
b
2
1 8,0 6,0 64,00 36,00
2 9,0 6,5 81,00 42,25
3 8,5 7,0 72,25 49,00
4 9,4 6,5 88,36 42,25
5 9,3 6,4 86,49 40,96
6 8,4 7,1 70,56 50,41
7 8,5 7,2 72,25 51,84
8 8,6 6,2 73,96 38,44
9 8,0 6,3 64,00 39,69
10 8,5 72,25
11 9,0 81,00
12 8,5 72,25
13 8,4 70,56
Sumas 112,10 59,20 968,93 390,84
Promedio y
Varianza
8,62 6.57 0,19 0,18
Consultando la tabla de t con n-1
grados de libertad (20) se encuentra
un valor de 2.086, por lo tanto, la
diferencia se declara significativa.
Conclusin: El rendimiento
observado por las plantas de semilla
seleccionada fue significativamente
superior a las otras.
09/08/2014
79
846 . 10
9
19 . 0
13
19 . 0
57 . 6 62 . 8
=
+

=
c
t
UNA MUESTRA: PRUEBA SOBRE UNA
SOLA PROPORCION
Considrese el problema de probar la hiptesis de
que la proporcin de xitos de un experimento
binomial es igual a algn valor especfico, as
H
0
: p = p
0

H
1
: p < p
0



Se utiliza una distribucin binomial para calcular el
valor de P as: P = P(X x cuando p = p
0
).
El valor de x es el nmero de xitos en nuestra
muestra de tamao n.
Si este valor P es menor o igual a o, nuestra
prueba es significativa en el nivel o y rechazamos
H
0
a favor de H
1
.
09/08/2014 80
UNA MUESTRA: PRUEBA SOBRE UNA
SOLA PROPORCION (continuacin)
De madera similar para probar la hiptesis
H
0
: p = p
0
H
1
: p > p
0

En el nivel de significancia o calculamos
P = P(X > x cuando p = p
0
)
El valor de x es el nmero de xitos en
nuestra muestra de tamao n.
Si este valor P es menor que o igual a o,
nuestra prueba es significativa en el nivel o y
rechazamos H
0
a favor de H
1
.

09/08/2014 81
UNA MUESTRA: PRUEBA SOBRE UNA
SOLA PROPORCION (continuacin)
Finalmente para la hiptesis


H
0
: p = p
0


H
1
: p p
0
Al nivel de significancia o, calculamos
P = 2P(X x cuando p = p
0
) si x < np
0
, o
P = 2P(X x cuando p = p
0
) si x > np
0
El valor de x es el nmero de xitos en nuestra
muestra de tamao n.
Si este valor P es menor o igual a o, nuestra
prueba es significativa en el nivel o y rechazamos
H
0
a favor de H
1
.

09/08/2014 82
Ejemplo 10.10 W
Un constructor afirma que se instalan bombas de calor en 70% de
todas las casas que se construyen actualmente en una ciudad.
Estara de acuerdo con esta afirmacin, si una encuesta aleatoria de
casas nuevas en esta ciudad demuestra que 8 de 15 tienen instaladas
bombas de calor? Utilice un nivel de significancia del 0.10.
Solucin: 1. H
0
: p = 0.7
2. H
1
: p 0.7
3. o = 0.10
4. Estadstico de prueba: Variable binomial X con p = 0.7 y n = 15
5. Clculos: x = 8 y np
0
= (15)(0,7) = 10.5. Por lo tanto el valor
de P calculado es:

6. Decisin: No rechace H
0
, ya que no hay razn suficiente para dudar
de la afirmacin del constructor.
09/08/2014 83
( ) ( ) 10 . 0 2622 . 0 7 . 0 , 15 ; 2 7 . 0 | 8 2
8
0
> = = = s =

= x
x b p X P P
Clculos de

09/08/2014 84
a = 0,1
n = 15
x p
0 0,00000001
1 0,00000050
2 0,00000820
3 0,00008294
4 0,00058058
5 0,00298029
6 0,01159000
7 0,03477001
8 0,08113003
0,13114257
2p = 0,26228515
( ) ( ) 10 . 0 2622 . 0 7 . 0 , 15 ; 2 7 . 0 | 8 2
8
0
> = = = s =

= x
x b p X P P
Ejemplo 10.11 W
Un medicamento que se prescribe comnmente para aliviar la tensin
nerviosa se considera que es efectivo en tan solo el 60%. Resultados
experimentales con un nuevo frmaco que se suministra a una muestra
aleatoria de 100 adultos que padecen de tensin nerviosa demuestran
que 70 tuvieron alivio. Esta es evidencia suficiente para concluir que el
nuevo medicamente es superior al que se prescribe actualmente?
Utilice un nivel de significancia de 0.05.
Solucin: 1. H
0
: p = 0.6
2. H
1
: p > 0.6
3. o = 0.05
4. Regin crtica: z = 1,645
5. Clculos: x = 70, n = 100, = 70/100 = 0.7 y

P = P(Z > 2,04) < 0,0207

6. Rechace H
0
ya que P = 0.0207 es menor que o = 0.05 y concluya que
el nuevo frmaco es superior.
09/08/2014 85
( )( )
, 04 . 2
100 / 4 . 0 6 . 0
6 . 0 7 . 0
=

= z
n
q p
P
p
n
q p
P
p
Z
Z
. .
.
. .
.

=
s
2 /
2 /
o
o
p
.
Prueba Chi-cuadrada
La prueba de Chi cuadrada se usa para
determinar si una poblacin tiene una
distribucin terica especfica.
Las pruebas se basan en qu tan buen
ajuste se tiene, entre la frecuencia de
ocurrencia (FO) de las observaciones en
una muestra observada y las frecuencias
esperadas (FE) que se obtienen a partir de
la distribucin hipottica.
09/08/2014 86
Ejemplo 02:
Considere la distribucin de probabilidad que se obtiene al
lanzar un dado legal un determinado nmero de veces, lo
cual equivale a probar la hiptesis de que la distribucin de
resultados es la distribucin uniforme discreta y f(x) = 1/6,
para x = 1, 2, 3, 4, 5, 6.
Si lanzamos el dado 120 veces y se registra cada resultado, y
si el dado est balanceado, se experimentara que cada cara
ocurriera 20 veces.
Los resultados de este experimento se muestran a
continuacin:
09/08/2014 87
Frecuencias 1 2 3 4 5 6
Observada 20 22 17 18 19 24
Esperada 20 20 20 20 20 20
Ejemplo 02 (continuacin):
Al comparar las frecuencias observadas (FO) con las
frecuencias esperadas (FE) correspondientes, se debe
decidir si es posible que tales discrepancias ocurran
como resultado de fluctuaciones del muestreo y de que
el dado est balanceado o que ste no es legal, y de que
la distribucin de resultados no es uniforme.
La prueba de bondad de ajuste entre las FO y las FE se
basa en la cantidad
09/08/2014 88
( )

=
m
i
i
i i
FE
FE FO
1
2
2
0
_
( ) ( ) ( ) ( ) ( ) ( )
7 . 1
20
20 24 20 19 20 18 20 17 20 22 5 20 20
2 2 2 2 2 2
2
0
=
+ + + + +
= _
Ejemplo 02 (continuacin):
Los grados de libertad v se determinan as:
v = m (k 1), donde:
m = nmero de clases
k = nmero de parmetros de la distribucin
v = 6 (2 1) = 5
_
2
0.05,5
= 11.070

Como _
0
2
= 1.7 es menor que el valor crtico
_
2
0.05,5
= 11.070, no se rechaza H
0
. Se concluye
que no hay suficiente evidencia de que el dado no
est balanceado.
09/08/2014 89
Ejemplo 03:
Probar la hiptesis de que la distribucin de frecuencias
de las duraciones de bateras, dadas en la siguiente tabla
puede aproximarse mediante una distribucin normal
con media = 3.5 y una desviacin estndar o = 0.7.

09/08/2014 90
No. Clase LIC LSC
1 1,45 1,95 2
2 1,95 2,45 1
3 2,45 2,95 4
4 2,95 3,45 15
5 3,45 3,95 10
6 3,95 4,45 5
7 4,45 4,95 3
Lmite de Clase
Frecuencias Observadas
FO
Ejemplo 03 (continuacin):
Solucin: En los datos suministrado se observan
clases con frecuencias menores de 5, por lo
tanto hay que unir clases consecutivas para que
su frecuencia sea mayor o igual a 5, as:
09/08/2014 91
No. Clase LIC LSC
1 1,45 2,95 7
2 2,95 3,45 15
3 3,45 3,95 10
4 3,95 4,95 8
Nueva Tabla de Frecuencias Observadas
Lmite de Clase
FO
Ejemplo 03 (continuacin):
Para calcular las FE se debe calcular primero la
probabilidad esperada de cada frecuencia y el
resultado multiplicarlo por el nmero de datos n.
Clase 1:

=
..
.
=-2.93

=
..
.
=-0.79
P = P(-2.93 < Z < -0.79) = P(Z < -0.79) P(Z < -2.93)
P = 0.2143
FE = 0.2143 * 40 = 8.573

09/08/2014 92
Ejemplo 03 (continuacin):
Los clculos son los siguientes:







Los resultados de los clculos para cada FE se
muestran en la siguiente tabla:

09/08/2014 93
Clculo FE
1
Z
1
= -2,93 p = 0,2143
Z
2
= -0,79 FE
1
= 8,57
Clculo FE
2
Z
1
= -0,79 p = 0,2555
Z
2
= -0,07 FE
2
= 10,22
Clculo FE
3
Z
1
= -0,07 p = 0,2683
Z
2
= 0,64 FE
3
= 10,73
Clculo FE
4
Z
1
= 0,64 p = 0,2410
Z
2
= 2,071 FE
4
= 9,64
Ejemplo 03 (continuacin):
Las frecuencias observadas son:
09/08/2014
94
No. Clase LIC LSC
1 1,45 2,95 7 -2,93 -0,79 0,2143 8,573
2 2,95 3,45 15 -0,79 -0,07 0,2555 10,22
3 3,45 3,95 10 -0,07 0,64 0,2683 10,73
4 3,95 4,95 8 0,64 2,07 0,2410 9,64
Lmite de Clase
FO z
1
z
2
FE p
Nueva Tabla de Frecuencias Observadas y Frecuencias Esperadas
Ejemplo 03 (continuacin):
Clculo de _
2
0

09/08/2014 95
No. Clase LIC LSC
1 1,45 2,95 7 8,573 0,29
2 2,95 3,45 15 10,22 2,24
3 3,45 3,95 10 10,73 0,05
4 3,95 4,95 8 9,64 0,28
_
2
0
= 2,85
Nueva Tabla de Frecuencias Observadas y Frecuencias
Esperadas
Lmite de Clase
FO FE _
2
0
Ejemplo 03 (continuacin):
El valor de _
2
0.05,3
= 7.815

Conclusin: Como _
2
0
= 2.85 es menor que
_
2
0.05,3
= 7.815, no hay razn para rechazar H
0

y se acepta que la distribucin de
probabilidades que modela los datos de las
bateras es una distribucin normal con
media = 3.5 y una desviacin estndar
o = 0.7.



09/08/2014 96

Una hiptesis estadstica se defini como una
afirmacin o conjetura acerca de la distribucin
f(x,q) de una o ms variables aleatorias.
Igualmente se plante que la distribucin poda
tener uno o ms parmetros desconocidos, que
denotamos por q y que la hiptesis se relaciona con
este parmetro o conjunto de parmetros.
En otros casos, se desconoce por completo la forma
de la distribucin y la hiptesis entonces se relaciona
con una distribucin especfica f(x,q) que podamos
asignarle al conjunto de datos de la muestra.
Prueba Chi-cuadrada
09/08/2014 97
El primer problema, relacionado con los
parmetros de una distribucin conocida o
supuesta es el problema que hemos analizado en
los prrafos anteriores.

Ahora examinaremos el problema de verificar si el
conjunto de datos se puede ajustar o afirmar que
proviene de una determinada distribucin.

Las pruebas estadsticas que tratan este problema
reciben el nombre general de Pruebas de Bondad
de Ajuste. Se analizarn dos pruebas bsicas que
pueden aplicarse:
09/08/2014 98
La prueba de bondad de ajuste de Chi - Cuadrado y la
prueba de bondad de ajuste de Kolmogorov-
Smirnov.

Ambas pruebas caen en la categora de lo que en
estadstica se denominan pruebas de Bondad de
Ajuste y miden, como el nombre lo indica, el grado
de ajuste que existe entre la distribucin obtenida a
partir de la muestra y la distribucin terica que se
supone debe seguir esa muestra.

Ambas pruebas estn basadas en la hiptesis nula de
que no hay diferencias significativas entre la
distribucin muestral y la terica.
09/08/2014 99
Se utiliza una prueba de bondad de ajuste cuando se desea
determinar si un conjunto de datos se ajusta a alguna
distribucin especifica.
Prueba de Bondad de Ajuste
09/08/2014 100
Prueba de Bondad de Ajuste
de chi cuadrado
La prueba de bondad de ajuste de chi cuadrado est
basada en la estadstica
que tiene una distribucin chi cuadrado con k - 1 grados de
libertad, donde:
k : Nmero de clases, fo
i
: frecuencias observadas, fe
i
: frecuencias
esperadas.
Para utilizar esta estadstica es necesario que fe
i
5; en algunos
casos es necesario combinar celdas adyacentes para superar este
inconveniente.
09/08/2014 101
09/08/2014 102
grado
09/08/2014 103
DETERMINACION DEL TIPO DE
DISTRIBUCION
1. Series de Tiempo.
2. Tabla de Frecuencias.
3. Tipo de Distribucin.
4. Validacin tipo de Distribucin:
a) Prueba de bondad de ajuste de _
2
(Ji-Cuadrado).
b) Prueba de bondad de ajuste de Kolmogorov
Smirnov.
09/08/2014 104
Series de Tiempo:
La mayor parte de la informacin se encuentra
distribuida en series a travs del tiempo, as:
DA PRODUCCIN DA PRODUCCIN
1 25 11 5
2 5 12 7
3 3 13 10
4 8 14 42
5 6 15 8
6 8 16 11
7 2 17 15
8 13 18 20
9 15 19 30
10 45
09/08/2014 105
Grfico de la Serie de Tiempo
0
5
10
15
20
25
30
35
40
45
50
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
DIAS
P
R
O
D
U
C
C
I
O
N
09/08/2014 106
(continuacin)
Esta informacin, tabulada en dicho formato
no es de utilidad cuando se trata de obtener
un comportamiento basado en variabilidad con
cierto comportamiento probabilstico.
As pues, si el analista desea conocer el
comportamiento, es necesario modificar la
forma de datos y presentarla como tablas de
frecuencia, con la finalidad de realizar
cualquiera de las siguientes pruebas:
a) Prueba de bondad de ajuste de _
2
(Ji-Cuadrado)
b) Prueba de bondad de ajuste de Kolmogorov -
Smirnov

09/08/2014 107
DATOS OBSERVADOS DE LA DEMANDA DE AUTOMOVILES DURANTE 42 DIAS
DIA DEMANDA DIA DEMANDA DIA DEMANDA DIA DEMANDA
1 11 12 11 23 7 34 1
2 10 13 0 24 13 35 2
3 0 14 7 25 11 36 7
4 2 15 6 26 8 37 1
5 7 16 8 27 3 38 5
6 5 17 1 28 2 39 9
7 8 18 4 29 2 40 13
8 12 19 4 30 0 41 10
9 13 20 3 31 12 42 12
10 9 21 11 32 7
11 9 22 7 33 5
Ejercicio No. 1:
09/08/2014 108
DEMANDA DE AUTOMOVILES DURANTE 42
DIAS
0
2
4
6
8
10
12
14
147
1
0
1
3
1
6
1
9
2
2
2
5
2
8
3
1
3
4
3
7
4
0
DIAS
D
E
M
A
N
D
A
Regla de Sturges
m = 3.3(log n) + 1
Donde n es el nmero de medidas y
log n es el logaritmo de n en base 10
CLCULO DEL NMERO DE CLASES
n m =
09/08/2014 109
GRFICO DE FRECUENCIAS
0
2
4
6
8
1 2 3 4 5 6 7
INTERVALO
F
R
E
C
U
E
N
C
I
A
SOLUCION UTILIZANDO LA PRUEBA DE BONDAD DE AJUSTE DE
JI-CUADRADO
1- Agrupar lo n datos en una tabla de frecuencia con:
7 36 , 6
1 623 , 1 * 3 , 3
1 ) 42 log( 3 , 3
7 48 . 6
42
~ =
+ =
+ =
~ =
=
=
m
m
m
m
m
n m
R = U L
w = R/m
INTERVALO FRE. OBSERV.
DE A FO
i
1 -0,5 1,5 6
2 1,5 3,5 6
3 3,5 5,5 5
4 5,5 7,5 7
5 7,5 9,5 6
6 9,5 11,5 6
7 11,5 13,5 6
NUMERO DE
CLASES m
TABLA DE FRECUENCIA
09/08/2014 110
2- Establecer la hiptesis
Con base en el grfico de la tabla de
frecuencias, la distribucin de probabilidades
que mejor modela los datos es la distribucin
uniforme, con parmetros b = 13,5 y a = -0,5,
quedando de esta forma:

09/08/2014 111
14
1
) 5 , 0 ( 5 , 13
1 1
) ( =

=

=
a b
x f
H
0
: La distribucin es Uniforme, as:
H
1
: La distribucin no es Uniforme
14
1
) ( = x f
3- Calcular la frecuencia esperada FE
i

Con base en la distribucin de probabilidades
propuesta en la hiptesis nula, se calcula la
frecuencia esperada as:


Como la hiptesis es una distribucin uniforme,
todos los intervalos tienen la misma frecuencia
esperada, as:

09/08/2014 112
} }
= =
i
i
i
i
ls
li
ls
li
i
dx n dx x f n FE
14
1
) (
6
14
2
42
14
42
14
1
42
5 . 5
5 . 3
5 . 5
5 . 3
3
= = = =
}
x
dx FE
En la siguiente tabla se muestra el
clculo de las frecuencias esperadas


09/08/2014 113
INTERVALO FRE. OBSER. FRE. ESPER.
DE A FO
i
FE
i
1 -0,5 1,5 6 6
2 1,5 3,5 6 6
3 3,5 5,5 5 6
4 5,5 7,5 7 6
5 7,5 9,5 6 6
6 9,5 11,5 6 6
7 11,5 13,5 6 6
NUMERO
DE
CLASES
m
1
o
. TABLA DE FRECUENCIA
4- Clculo del Estimador
0
2
Este estimador se calcula utilizando la siguiente
ecuacin:


Desarrollndola se tiene:
09/08/2014 114
( )

=
m
i
i
i i
FE
FE FO
1
2
2
0
_
( ) ( ) ( )
333 , 0
6
6 7 6 6 5 6 5
2 2 2
2
0
=
+ +
= _
5- Comparacin del estimador _
0
2
con _
2
o,v
Si el estimador _
0
2
es menor o igual que el valor
correspondiente a _
2
o,v
con v = m (k -1) grados de
libertad y un nivel de confianza de 1 o, entonces no
hay razn para rechazar la hiptesis nula.
Para el ejemplo se tiene:


Como _
0
2
= 0,333 es mucho menor que _
2
0.05,6
= 12,59
no hay razn para rechazar la hiptesis nula de que la
distribucin de probabilidades es uniforme.

09/08/2014 115
59 . 12
2
6 , 05 . 0
2
)) 1 2 ( 7 ,( 05 . 0
2
)) 1 ( ,(
= = =

_ _ _
o k m
09/08/2014 116
Ejercicio No. 2:
DIA DEMANDA DIA DEMANDA DIA DEMANDA DIA DEMANDA
1 1 14 5 27 4 40 1
2 2 15 1 28 1 41 8
3 3 16 2 29 6 42 2
4 4 17 7 30 1 43 1
5 1 18 1 31 5 44 5
6 2 19 2 32 2 45 2
7 1 20 4 33 1 46 3
8 2 21 3 34 4 47 4
9 1 22 1 35 3 48 7
10 3 23 6 36 2 49 2
11 5 24 1 37 1 50 6
12 2 25 3 38 2 51 1
13 1 26 1 39 3 52 2
DATOS OBSERVADOS DE LA DEMANDA DE CAF DURANTE 52 DAS
09/08/2014 117
09/08/2014 118
SOLUCION UTILIZANDO LA PRUEBA DE BONDAD DE AJUSTE DE JI-
CUADRADO
1- Agrupar lo n datos en una tabla de frecuencia con:
8 2111026 , 7 52 ~ = = = n m
R = 8 w = 1
FRE. OBS.
DE A FO
i
1 0,5 1,5 17
2 1,5 2,5 13
3 2,5 3,5 7
4 3,5 4,5 5
5 4,5 5,5 4
6 5,5 6,5 3
7 6,5 7,5 2
8 7,5 8,5 1
SUMA 52
NUMERO DE CLASES m
TABLA DE FRECUENCIA
INTERVALO
09/08/2014 119
0
2
4
6
8
10
12
14
16
18
20
0 2 4 6 8 10
F
R
E
C
U
E
N
C
I
A

DA
GRFICO DE FRECUENCIA FO
i
2- Establecer la hiptesis
09/08/2014 120
Con base en el grfico de la tabla de frecuencias, la distribucin de
probabilidades que mejor modela los datos es una distribucin
exponencial con media = 2,769, quedando de esta forma:

769 , 2 /
769 , 2
1 1
) (
x
x
e x f
e

= =

INTERVALO FRE. OBS.


DE A FO
i
1 0,5 1,5 17 1 17
2 1,5 2,5 13 2 26
3 2,5 3,5 7 3 21
4 3,5 4,5 5 4 20
5 4,5 5,5 4 5 20
6 5,5 6,5 3 6 18
7 6,5 7,5 2 7 14
8 7,5 8,5 1 8 8
Suma = 52 SUMATORIA = 144
MEDIA = 2,769
NUMER
O DE
CLASES
MARCA DE
CLASE
MC * FO
i
TABLA DE FRECUENCIA
09/08/2014 121
3- Calcular la frecuencia esperada FE
i

Con base en la distribucin de probabilidades
propuesta en la hiptesis, se calcula la
frecuencia esperada as:


Como la hiptesis es una distribucin
exponencial, todos los intervalos tienen
diferente frecuencia esperada, as:

Compendi: Ing. Rodrigo Wadnipar
} }

= =
i
i
i
i
ls
li
x
ls
li
i
dx e n dx x f n FE
769 , 2 /
769 , 2
1
) (
7611 , 15 3031 . 0 * 52 1 52
769 , 2
1
52
5 . 1
5 . 0
769 , 2
5 . 1
5 . 0
769 , 2 /
1
= =
|
|
.
|

\
|
= =

}
x
x
e dx e FE
09/08/2014 122
e = 2,71828182846
n = 52

= 2,769
Clase
e
-x/2,769
1 - e
-x/2,770
Prob
i
FE
i
lim sup = 1 0,6969 0,3031 0,3031 15,7611
2 0,4857 0,5143 0,2112 10,9839
3 0,3385 0,6615 0,1472 7,6547
4 0,2359 0,7641 0,1026 5,3346
5 0,1644 0,8356 0,0715 3,7177
6 0,1146 0,8854 0,0498 2,5909
7 0,0798 0,9202 0,0347 1,8056
>8 0,0000 1,0000 0,0798 4,1515
Totales 1,00000 52
CALCULOS DE LA FRECUENCIA ESPERADA
09/08/2014 123
INTERVALO FRE. OBS. FRE. ESP.
DE A FO
i
FE
i
1 0,5 1,5 17 15,7611
2 1,5 2,5 13 10,9839
3 2,5 3,5 7 7,6547
4 3,5 4,5 5 5,3346
5 4,5 5,5 4 3,7177
6 5,5 6,5 3 2,5909
7 6,5 7,5 2 1,8056
8 7,5 8,5 1 4,1515
SUMA 52 52
NUMERO DE
CLASES m
TABLA DE FRECUENCIA
09/08/2014 124
4- Clculo del Estimador
0
2

Este estimador se calcula utilizando la siguiente
ecuacin:


( )

=
m
i
i
i i
FE
FE FO
1
2
2
0
_
FRE. OBS. FRE. ESP.
FO
i
FE
i
17 15,7611 0,0974
13 10,9839 0,3700
7 7,6547 0,0560
5 5,3346 0,0210
4 3,7177 0,0214
3 2,5909 0,0646
2 1,8056 0,0209
1 4,1515 2,3924
3,0438 ESTIMADOR _
0
2
=
(FE
i
- FO
i
)^2 /FE
i
09/08/2014 125
5- Comparacin del estimador _
0
2
con _
2
o,v

Si el estimador _
0
2
es menor o igual que el valor
correspondiente a _
2
o,v
con m (k -1) grados de
libertad y un nivel de confianza de 1 o, entonces no
hay razn para rechazar la hiptesis nula.
Para el ejemplo se tiene:


Como _
0
2
= 3,0438 es mucho menor que _
2
0.05,8
= 15,51
no hay razn para rechazar la hiptesis nula de que la
distribucin de probabilidades es exponencial con media
= 2,769.

Compendi: Ing. Rodrigo Wadnipar
51 , 15
2
8 , 05 . 0
2
)) 1 1 ( 8 ,( 05 . 0
2
)) 1 ( ,(
= = =

_ _ _
o k m
09/08/2014 126
EJEMPLOS RESUELTOS
( ) ,
! x
e
x f
x

=

x = 0, 1, 2, ...
09/08/2014 127
09/08/2014 128
09/08/2014 129
5
09/08/2014 130
09/08/2014 131
uniforme
09/08/2014 132
uniforme.
uniforme.
uniforme.
09/08/2014 133
09/08/2014 134
( ) ( )
( ) ( ) 315 , 0 05 , 0 1 05 , 0
1
10
1
599 , 0 05 , 0 1 05 , 0
0
10
0
1 10
1
0 10
0
=
|
.
|

\
|
=
=
|
.
|

\
|
=

p
p
09/08/2014 135
09/08/2014 136
09/08/2014 137
09/08/2014 138
( ) ( ) ( ) ( )
8 . 1
40
40 44
40
40 34
40
40 44
40
40 38
2 2 2 2
0
2
=

= _
09/08/2014 139
EJERCICIOS PROPUESTOS
EJERCICIO EN CLASE 01
Determine si los contenidos de nicotina de cierta marca
de cigarrillos se ajustan a una distribucin normal de
media = 1,8 y desviacin estndar o = 0,4: si una
muestra aleatoria de contenidos arroj los siguientes
valores:
0,7 1,4 1,6 1,7 1,8 1,9 2,1 2,3
0,9 1,5 1,6 1,7 1,8 1,9 2,1 2,3
1,1 1,5 1,7 1,7 1,8 1,9 2,1 2,4
1,2 1,6 1,7 1,8 1,9 1,9 2,1 2,5
1,4 1,6 1,7 1,8 1,9 1,9 2,2 2,6
09/08/2014 140
EJERCICIO EN CLASE 02
Se seleccionan 3 artculos de un lote que contiene
5 artculos defectuosos y 3 artculos no
defectuosos. Despus de registrar el nmero X de
artculos defectuosos, los artculos se reemplazan
al lote y el experimento se repite 300 veces. Los
resultados obtenidos son los siguientes:


Con un nivel de signicancia de 0,05 pruebe la
hipotesis que los datos registrados se pueden
ajustar mediante una distribucin hipergeomtrica
h(x; 8, 3, 5), x = 0, 1, 2, 3.
x 0 1 2 3
f(x) 6 83 156 55
09/08/2014 141
EJERCICIO EN CLASE 03
De acuerdo con el ejercicio anterior, suponga que
la seleccin se realiza una por uno con
reemplazo, realice el experimento 100 veces y
determine si el nmero de artculos
seleccionados Y se ajustan a una distribucin
binomial (Establezca cules sern los parmetros)
09/08/2014 142
EJERCICIO EN CLASE 04
Un proveedor indica que siempre entrega su mercanca en 7
das o menos, el jefe del almacn hizo un muestreo de las
ltimas entregas de este proveedor y obtuvo los siguientes
das de entrega para sus pedidos:







Preguntas:
a) Verifique si en realidad sus pedidos tardan 7 das o menos.
b) Cul es la distribucin de probabilidades de las entregas de
sus pedidos, use la prueba de bondad de ajustes de Ji-
cuadrado

09/08/2014 143
8 12 7 2 5 9
11 6 8 14 7 13
9 5 7 5 9 8
7 11 6 8 6 8
9 10 9 4 9 8
11 11 9 5 8 9
12 10 8 10 5 4
6 11 8 4 7 6
8 8 8 10 11 6
6
EJERCICIO EN CLASE 05
La siguiente tabla muestra la demanda de caf a
travs del tiempo en toneladas/da, con base en esa
informacin y usando la prueba de Ji-Cuadrado
determine la distribucin de probabilidades que ms
se ajusta a esos datos.

09/08/2014 144
DIA DEMANDA DIA DEMANDA DIA DEMANDA DIA DEMANDA
1 0 14 5 27 4 40 3
2 2 15 13 28 8 41 6
3 3 16 9 29 10 42 9
4 4 17 7 30 1 43 1
5 1 18 10 31 5 44 5
6 9 19 2 32 16 45 12
7 0 20 4 33 2 46 0
8 2 21 8 34 4 47 4
9 21 22 3 35 5 48 7
10 8 23 6 36 0 49 2
11 7 24 11 37 1 50 6
12 2 25 1 38 11 51 1
13 0 26 14 39 2
DATOS OBSERVADOS DE LA DEMANDA DE CAF DURANTE 51 DAS
EJERCICIO EN CLASE 06
El peso en Kg. De 50 piezas se comporta
aleatoriamente de acuerdo con:



Con base en los anteriores datos, determine
con un nivel de confianza del 95%, la
distribucin de probabilidades que ms se
adecue a ellos: Use la prueba de bondad de
ajuste de Ji cuadrado

09/08/2014 145
0.13 45.22 8.64 93.11 39.73 43.45 108.00 0.74 46.06 32.37
120.50 56.14 33.80 12.78 7.08 2.87 77.08 18.60 55.67 5.50
45.41 28.94 151.90 17.51 32.93 19.06 17.53 8.75 3.20 14.86
20.87 6.44 3.20 103.90 20.90 47.26 120.30 0.62 29.57 33.31
35.72 16.93 17.72 10.02 33.35 55.91 3.03 20.81 34.56 9.94