Documentos de Académico
Documentos de Profesional
Documentos de Cultura
demuestreo
X 1, , X n
Sean
f (x) . Se define
X 1, , X n
como una
x
f ) y su distribucin de
f ( x 1 , x 2 , , x n )=f ( x 1 ) f ( x 2) f ( x n)
Cualquier funcin de las variables aleatorias que forman una muestra
aleatoria se llama estadstico
X 1, , X n
Def: Si
1
X = X i
n i=1
Def: Si
X 1, , X n
S 2=
Si
1
( X X )2
n1 i=1 i
2
( ) ]
1
S=
n X i2
n(n1) i=1
2
Xi
i =1
S , la raz cuadrada
Distribuciones muestrales
La distribucin de probabilidad de un estadstico se llama distribucin
muestral
X
/n ,
21
22
Conforme
n1 y n 2 de
y varianzas
2
X 1 X
, est distribuida aproximadamente de
x x = 12
1
2
x 1x 2
21 22
= +
n1 n2
De aqu
Z=
( X 1 X 2) ( 1 2 )
1 2
+
n1 n2
S2
que se
2 , entonces el
2
( n1 ) S2 n ( X i X )
=
=
2
2
i=1
2
v =n1
grados de libertad.
Teo: Sea Z una variable aleatoria normal estndar y V una variable aleatoria
chi cuadrada con
v grados de libertad. Si
Z y
T=
son independientes,
T , donde
Z
V / v
h (t)=
(v+1 )/ 2
[ ( v +1 ) /2 ]
t2
1+
v
( v /2 ) v
( )
,<t<
grados de libertad.
y desviacin estndar
. Sea
1
X = X i
n i=1
S 2=
2
1
X i X )
(
n1 i=1
T=
X
S /n
Intervalodeconfianza
P [ I ( X ) ] 1 .
Cuando un intervalo aleatorio I(X) tiene una probabilidad menor del 100*%
de que el parmetro no est en el intervalo decimos que el intervalo es de
confianza 1-, o de significacin .
Esto significa que en el 95% de los casos los intervalos de confianza dieron
una respuesta correcta. En el 5% restante se obtuvo una respuesta
incorrecta. No se trata de una probabilidad, ya que fijada la muestra, el
intervalo slo puede estar o no estar en este intervalo. Significa ms bien
que si hubiramos tomado una gran cantidad de muestras, se el parmetro
se encuentra 1- de las veces en ese rango.
Intervalos de confianza para la media
En la distribucin normal de medias se puede calcular el intervalo de
confianza donde se encuentra la media poblacional con una confianza
determinada como se muestra en la Ilustracin par aun intervalo de 1-.
Para esto se necesitan calcular los puntos X-/2 y X/2. Estos dos puntos
indican de dnde a dnde va el intervalo. Usando una muestra
estandarizada se conocen los valores Z-/2 y Z/2 al 95% y al 99% de la
distribucin normal. Sus aproximaciones son: 1.96 y 2.576.
Z
2
, x + Z
2 n
2 n ).
x Z
/2
a la derecha.
Gradosdelibertad
Pruebassobreunasolamedia(varianzadesconocida)
Ladistribucint
n
S /
( X )
se
T=
X
S /n .
n
/
distribucin normal estndar y V tiene una distribucin chi2 con n-1 grados
de libertad.
La distribucin de probabilidad T se public por primera vez en 1908 en un
trabajo de S. Gosset. Gosset era empleado de una cervecera irlandesa que
desaprobaba la publicacin de trabajos de investigacin. Por esta razn
Gosset public el trabajo con el seudnimo de Student.
La distribucin T al igual que la distribucin normal es simtrica alrededor
de una media 0
Ambas tienen forma de campana, pero la T vara ms, debido a que
depende de dos cantidades, media y varianza, mientras que Z slo depende
de la media. Cuando n tiende hacia infinito las dos distribuciones son
iguales.
Si se hacen tablas para todos los n<30, stas seran muy grandes. Por eso
la tabla que se usa slo contiene los valores para especficos (0.1, 0.05,
0.025,0.01,0.005). En esta tabla, al revs de la tabla para la distribucin
normal, ya que las reas son los encabezados de las columnas y adentro
estn los valores t. A la izquierda estn los grados de libertad.
Ya que T es simtrica
t 0.95=t 0.05
Ejemplo: Calcular
t 0.99=t 0.01
P=10.050.025=0.925 .
Intervalo de confianza de
; con
desconocida
t 0.05
Si
( 1 ) 100
para
es
x t
2
Donde
/2
t
2
s
s
< < x +t
n
2 n
a la derecha.
Pruebasdehiptesis
Con frecuencia, los problemas a los que se enfrentan los cientficos no se
refieren solamente a la estimacin de un parmetro poblacional, sino a la
toma de una decisin basada en datos que puedan permitir llegar a una
conclusin acerca de algn sistema. Por ejemplo, un investigador puede
decidir exponer las plantas a un abono, aumenta o no el crecimiento.
El problema que se estudia y la decisin que se quiere tomar se pueden
postular bajo la forma de una hiptesis estadstica.
Hiptesisestadstica
Es una afirmacin acerca de una o ms poblaciones. Nunca se sabe con
absoluta certeza la verdad de una hiptesis estadstica, a no ser que se
examine la poblacin entera. Esto, por supuesto, es imposible en la mayora
de las situaciones. Por esta razn, lo que se hace es tomar una muestra
aleatoria de la poblacin de inters y usar los datos que contiene tal
muestra para proporcionar evidencias que confirmen o no la hiptesis.
Al momento de disear un proceso de decisin es importante tener en
cuenta que hay una probabilidad de que la conclusin sea equivocada. Un
ingeniero, por ejemplo, puede plantear la hiptesis de que la fraccin de
artculos defectuosos en un cierto proceso es de 0.1. El experimento
consiste en observar una muestra aleatoria del proceso en cuestin. Se
verifican 100 y se encuentra que 12 son defectuosos. Es de sentido comn
concluir que este resultado no rechaza la hiptesis de que se esperaban 10
artculos defectuosos. Sin embargo, es posible que p=12 o incluso p=15. Por
esta razn es importante dejar bien claro que simplemente los datos no
permiten rechazar la hiptesis, no se trata de aceptar esa hiptesis. Si, por
el contrario se muestrean 20 objetos defectuosos, se debe rechazar la
hiptesis de p=10, aunque haya una pequea probabilidad de que esta
conclusin sea equivocada y de que la hiptesis de 10 defectuosos sea
correcta.
El planteamiento de una hiptesis se hace generalmente de forma que no
se pueda rechazar lo que se quiere demostrar como verdadero. Esta es la
mejor forma de respaldar con fuerza un argumento. Por ejemplo, si un
investigador desea mostrar evidencia contundente a favor del argumento de
que el caf aumenta el riesgo de cncer, la hiptesis que probar ser: No
hay aumento de riesgo de cncer debido a la ingestin de caf. Es decir,
que el argumento se alcanza a travs de un rechazo. Si se rechaza esa
hiptesis, significa que los datos no permiten rechazar la hiptesis de que
no hace dao, as que se acepta la hiptesis alternativa de que s hace
dao.
Loquesequiereprobar
Tomarcafdacncer
Unmedidoresmsprecisoqueotro
Unapoblacinesmsgrandequela
otra
Lamediaesmenorque0.5
Losamuletostraensuerte
Lahiptesisnula
Elriesgodecnceresigualsisetoma
caf
Ambossonigualesencuantoala
precisin
Lasdospoblacionessoniguales
Lamediaiguala0.5
Losamuletosnotraensuerte
ErrortipoI
Concluirqueshayaumentod
riesgoaunquenolohaya
Concluirqueshaydiferencia
aunquenolahaya
Concluirquelaspoblacioness
distintasaunqueseaniguales
Concluirquelamediaesmeno
siendoqueesigualomayora0
Concluirquetraensuerte,cuan
realidadnolatraen.
Lahiptesisnulaylahiptesisalternativa
La estructura de la prueba de hiptesis se formular utilizando el trmino
hiptesis nula. Esto se refiere a la hiptesis que se desee probar (rechazar)
y se representa por H0. El rechazo de H0 da como resultado la aceptacin de
una hiptesis alternativa, que se representa por H1. Una hiptesis nula
referente a un parmetro poblacional siempre ser establecida en forma tal
Pruebadeunahiptesisestadstica
1 2
H0 es verdadera
H0 es falsa
No rechazar H0
Decisin
correcta
Error tipo II
Rechazar H0
Error tipo I
Decisin
correcta
20
1
1
1
= b x ; 20, =1 b x ; 20, =10.9591=0.0409
4 x=9
4
4
x=0
Se dice entonces que la hiptesis nula, p=1/4 se est probando con el nivel
de significancia =0.0409. Tambin se puede ver el nivel de significancia
como el tamao de la regin crtica. Una regin crtica de tamao 0.0409 es
muy pequea y, por lo tanto, es poco probable que se cometa un error tipo
I.
La probabilidad de cometer un error tipo II, representado por es imposible
de calcular, a menos de que la hiptesis alternativa tenga valores muy
precisos. En lo ideal el procedimiento debera tener ambos tipos de error
pequeos. Para evitar disminuir un tipo de error a expensas del otro, lo ideal
es aumentar el tamao de la muestra. De esta forma se asegura que se
disminuyen ambos tipos de error.
Si ahora utilizamos una muestra de 100 individuos y ms de 36 sobrepasan
el perodo de 2 aos sin virus, se rechaza la hiptesis de que p=1/4 y se
acepta la alternativa de p>1/4. El valor crtico ahora es 36. Los valores
arriba de 36 caen en la regin crtica y todos los posibles valores menores o
iguales a 36 caen en la regin de no rechazo.
=36
=25
=np=
1001
=25
4
1001
3
4
= npq=
=4.33
4
La probabilidad est dada por el rea bajo la curva a la derecha del valor
crtico 36, es decir a partir de 36.5. Lo que se hace es encontrar el rea bajo
la curva de una distribucin normal estandarizada (normalizada). Estos
valores estn tabulados y no es necesario calcularlos cada vez. El valor de la
curva normal estandarizada correspondiente se calcula restando la media y
dividiendo por la desviacin estndar as:
z=
36.525
=2.66 . El rea para
4.33
1
P ( Z> 2.66 )=10.9961=0.0039
4
H 0 : =68
H 1 : 68
La hiptesis alternativa incluye la posibilidad de que
x < 67 y x >69 . La
67 x 69 (Ilustracin 1).
Se rechaza H0
68
z 1=
6768
=1.67 ,
0.6
z 2=
6968
=1.67
0.6
67 69
Ilustracin: distribucin de probabilidad aproximada a la normal indicando las
zonas de rechazo en amarillo
Por lo tanto
Ejercicio:
Plantear la hiptesis nula y el error tipo I que se puede cometer para probar
las siguientes afirmaciones:
Se quiere probar que la vacuna 1 es mejor que la 2
La altura sobre el nivel del mar influye en el nmero de infartos
Dos poblaciones son diferentes genticamente
Dos dietas distintas influyen sobre el peso
Pruebasdeunacolaydedoscolas
Una prueba de cualquier hiptesis estadstica, donde la alternativa es
unilateral tal como
H 0 :=0 ,
H 1 :> 0
una cola. Generalmente la regin crtica para esta hiptesis alternativa cae
en la cola derecha de la distribucin normal.
Una prueba de hiptesis estadstica donde la alternativa es bilateral
H 0 :=0 ,
H 1 : 0
Losvaloresp
z> 1.96; z <1.96 . Un valor de z que caiga en la regin crtica sugiere que
el valor del estadstico de prueba es significativo.
Lo que se hace es fijar para controlar al mximo el riesgo de cometer un
error tipo I. Para los valores que estn cerca del rea bajo la curva, es decir,
la probabilidad de cometer un error tipo I, no aumenta mucho. Por ejemplo,
si el valor de z es 1.87, la probabilidad de cometer el error tipo I es 0.0614.
Sin embargo, se ha establecido que se evala la significancia de una prueba
con niveles de 0.05 y de 0.01.
La definicin formal de valor P es:
Un valor P es el nivel ms bajo (de significancia) en el cual el valor
observado del estadstico de prueba es significativo. En otras palabras, es la
probabilidad obtener un resultado igual o ms extremo que el observado. Si
es poco extremo, es posible que el resultado se deba al azar nicamente.
ElvalorE(Evalue)
Resumendelospasospararealizarunapruebadehiptesis:
Establecer la hiptesis H 0 :
= 0
Repasodedefiniciones
Pruebasrelacionadasconunasolamedia
La prueba que hemos realizado entra dentro de esta categora. Aqu
hablaremos para el caso de una sola media poblacional y varianza conocida
de la poblacin (es decir, el parmetro) y con distribucin normal. Este tipo
de pruebas sirven para experimentos con un X1,X2,,Xn que representan una
muestra aleatoria de una distribucin con media y varianza
2 >0 . Se
H 0 : =0
H 1: 0
X , es
x .
X
0
/ n
= 0 ,
H 0 , es decir cuando
deducir que
P z a <
2
X 0
< z a =1
2
n
calculado de
entre
z a
za
2
z a < z < z a
2
si z est
H 1: 0
H0
0 :
H0
Se rechaza
b= 0 + z a/ 2
/2
si
x < a , donde
a= 0z a /2
(Ilustracin).
1-
x > b o
/2
Esta prueba se puede convertir igualmente en una prueba de una sola cola
si se quiere probar:
H 0 : =0
H 1 : > 0
Ejemplo:
Una muestra aleatoria de 100 muertes registradas en USA durante el ao
pasado mostr una vida promedio de 71.8 aos. Suponiendo que la
desviacin estndar poblacional es de 8.9 aos. Esto indica que la vida
promedio es mayor de 70 aos?
H 0 : =70 aos
H 1 : >70 a os
=0.05
Regin crtica: z>1.64 por el nivel de significancia (Ilustracin)
z=
x 0
/n
71.870
=2.02
8.9/ 100
2.02
Ilustracin: distribucin de probabilidad indicando la zona de rechazo en
amarillo
Se rechaza
H0
Ejemplo:
Un fabricante de equipos deportivos ha desarrollado un nuevo sedal
sinttico para pesca que se considera tiene una resistencia de ruptura de 8
kg con una desviacin estndar de 0.5 kg. Queremos probar la hiptesis de
que
H 0 : =8 en contraposicin a H 1 : 8
x 0 7.88
z= / n = 0.5/ 50 =2.83
Se rechaza
H0
z=
x 0
/n
7.88
=2.83
0.5/ 50
Ejercicio:
Ejercicio:
Un fabricante asegura que sus bombillos duran 800 horas en promedio con
una desviacin estndar de 40 horas. Para probar una nueva produccin
realiza un experimento con 30 bombillos y obtiene una media de 788 horas
de duracin. Plantee la hiptesis y realice la prueba comparando el valor p
del estadstico de prueba con =0.04. Le sorprende la conclusin? A qu se
debe?
Ejercicio:
Relacinconlaestimacindelintervalodeconfianza
H 0 : =0
H 1: 0
Z=
x 0
/ n . Resulta que la
en un nivel de significancia es
Laprueba
n( X )/S
aleatoria
H 0 : =0
H 1 : 0 , el rechazo de
t=
x 0
s / n
H0
con un
que t/2,n-1.
Ejemplo:
Se afirma que el consumo de alimento semanal en biomasa del tapir andino
es de 46 kg. Se realiz un estudio observacional de 12 tapires en cautiverio
y se determin un consumo promedio de 42 kg con desviacin estndar de
11.9 kg. Sugiere el estudio que el consumo es menor de 46 kg en promedio
con un nivel de significancia de 0.05?
H 0 : =46
H 1 : < 46
t=
x 0
s / n
4246
=1.16
11.9 / 12
H0
y se
Pruebaparalasignificanciadeuncoeficientecorrelacin
Volvemos al coeficiente de correlacin y suponemos que queremos probar si
un coeficiente dado es significativamente diferente de cero. El coeficiente
de correlacin transformado se puede aproximar a la distribucin T:
t=
rs
(1r
2
s
1.1
Pruebassobredosmedias
El procedimiento experimental es parecido al descrito en la seccin
anterior. Dos muestras aleatorias independientes de tamaos n 1 y n 2
provienen de dos poblaciones con medias 1 y 2 y varianzas
Z=
21 y
21
( X 1 X 2) ( 12)
1 2
+
n1 n2
tiene una
z=
( X 1 X 2 )( 12 )
1 1
+
n1 n 2
H 1 : 1 2 d 0
H 0 : 12=d 0 . Se rechaza
H0
en favor de
si z>z/2 o z<-z/2.
Varianzasdesconocidas
t=
( X 1 X 2 )d0
sp
1 1
+
n1 n2
, donde
s1 ( n11 ) + s 2 ( n2 1 )
s =
n1+ n22
2
p
t
2
,n1+ n22
<t <t
2
, n1+n22
aleatoria:
t=
dd
0
S d / n , donde
Sd
calculado es entonces
t=
H 0 : D =d 0 . El estadstico
dd
0
sd/ n .
Ejemplo:
Se realiz un estudio en el cual se examin la influencia de la succinilcolina
sobre los niveles de andrgenos en la sangre. Se obtuvieron muestras de
sangre de 15 ciervos al momento de la inyeccin y 30 minutos despus (
). Se midieron los niveles de andrgenos en ng/ml. Pruebe si hay alguna
diferencia en los niveles antes y despus de las inyecciones con un nivel de
significancia de 0.05.
Ciervo
Inyeccin
30 minutos
Diferencia
2.76
7.02
-4.26
5.18
3.10
2.08
2.68
5.44
-2.76
3.05
3.99
-0.94
4.10
5.21
-1.11
7.05
10.26
-3.21
6.60
13.91
-7.31
4.79
18.53
-13.74
7.39
7.91
-0.52
10
7.30
4.85
2.45
11
11.78
11.10
0.68
12
3.90
3.74
0.16
13
26.00
94.03
-68.03
14
67.48
94.03
-26.55
15
17.04
41.70
-24.66
H 0 : 1=2 o D =12 =0
H 1 : 1 2 o D = 12 0
d=9.848
t=
s d =18.474
dd
9.8480
0
=
=2.06
s d / n 18.474/ 15
H 0 : 1=2 .
Ejemplo:
Una empresa envi a una parte de sus empleados a realizar un curso en Cali
y a otros en Bogot. El curso en Bogot cuesta ms y los directivos quieren
saber si este esfuerzo vale la pena. Para comprobarlo realizaron un examen
a los empleados. Las calificaciones fueron las siguientes:
Cali
98
99
99
97
90
85
84
82
81
79
68
61
60
Bogota
98
96
96
95
85
80
79
78
75
73
72
69
67
56
62
60
t=0.45
Pruebasparaproporciones
H 0 : p= p0
H 1 : p< p0
Se utiliza la distribucin binomial para calcular el valor P. El valor x es el
nmero de xitos en la muestra de tamao n. Para este caso unilateral:
P=P(Xx cuando p=p0)Para
H 0 : p=0.7
Recordando que
H 1 : p<0.7
()
b ( x ; n , p )= n p x q nx
x
8
z=
xn p0
n p0 q 0 .
z=
^p1 ^p2
1
1
^p q [
+
] , donde
n1
n2
( )( )
Ejemplo:
^p=
x 1+ x 2
n 1+ n2 .
p=0.6
H1:
p>0.6
=0.05
x=70
n=100
np 0=1000.6=60
z=
xn p0
7060
=
=2.04
n p0 q 0 1000.60.4
p A =0.55
H0:
p A =p B
H1:
pA pB
pB =0.48
=0.05
z=
pA pB
p Aq A pBq B
+
nA
nB
=1.86
Pruebadebondaddeajuste
Estas pruebas sirven para determinar si una poblacin tiene una distribucin
terica especfica. La prueba se basa en qu tan buen ajuste se tiene entre
la distribucin terica y la distribucin de las observaciones.
Observada
20
22
17
18
19
24
Esperada
20
20
20
20
20
20
Ladistribucinchi2
X 2=
(n1) S
2
tiene una
El estadstico de prueba es
de libertad. Si
chi 2
chi 2=
chi 2
para un nivel de
1.2
Tablasdecontingenciaypruebasdeindependencia
La prueba
chi 2
valores marginales.
La hiptesis nula
H 0 : hay independencia
TOTAL
Baja
Medi
a
Alta
Masculino
182
213
203
598
Femenino
154
138
110
402
TOTAL
336
351
313
1000
Frecuencia esperada=
Temperatura
TOTAL
Baja
Media
Alta
Masculino
182 (200.9)
213(209.9)
203(187.
2)
598(187.
2)
Femenino
154(135.1)
138(141.1)
110(125.
8)
402(125.
8)
TOTAL
336
351
313
1000
(observadoi esperado i)
chi =
esperado i
i=1
2
chi =
El valor de
chi 2
i=1
esperado i
chi =
Ejemplo:
Se pusieron 50 degustadores a escoger entre 5 vinos el mejor. Se trataba
del mismo vino servido en copas de color distinto. La pregunta a responder
es si hay influencia del color del vaso sobre el sabor del vino.
H0: el color no influencia el vino que se escoge como el mejor
H1: el color s influencia el vino que se escoge como el mejor
Vino
#devecesquefue
escogidocomoel
mejor
#devecesquefue
seesperasinohay
influencia
1
6
2
12
3
9
4
10
5
13
10
10
10
10
10
chi 2=
i=1
( obsiespi )2
=3 , Tabla chi2 con 4 gdl y =0.05: 9.48, as que no se
espi
Temaspararevisarencasa:
Tarea: Ejercicios pruebas de hiptesis Walpole & Myers (p. 315, ejercicios 1 a
3 y 338, ejercicios 1,7,22)
Walpole & Myers (1992). Pgina 315
1. Suponga que un especialista en alergias desea probar la hiptesis de
que al menos 30% del pblico es alrgico a algunos productos de
queso. Explique cmo este especialista podra cometer.
H0: al menos o ms del 30% es alrgico
H1: menos del 30% es alrgico
a) un error tipo I
b) un error tipo II
2. Un socilogo est interesado en la eficiencia de un curso de
capacitacin diseado para lograr que ms conductores se
acostumbren a utilizar cinturones de seguridad en el automvil.
a) qu hiptesis est probando esta persona so comete un error tipo
I al concluir errneamente que el curso de capacitacin no es
eficaz?
b) qu hiptesis est probando la persona si comete un error tipo II al
concluir errneamente que el curso de capacitacin es eficaz?
3. Una gran empresa manufacturera ha sido calificada como
discriminadora en sus prcticas de contratacin.
a) qu hiptesis est probndose si un jurado comete un error tipo I
al encontrar que la compaa es culpable
b) qu hiptesis est probndose si un jurado comete un error tipo II
al encontrar que la compaa es culpable
Tarea: Walpole & Myers (1992). Pgina 338
1. Una muestra aleatoria de 36 refrescos de una mquina despachadora
automtica tiene un contenido promedio de 21.9 decilitros, con una
desviacin estndar de 1.42 decilitros. Pruebe la hiptesis de que
u=22.2 decilitros en contraposicin a la hiptesis
nivel de significancia de
<22.2
con un
=0.05
0.72
1
0.81
0.62
1.32
1.24
0.99
0.90
0.74
0.88
0.94
1.16
0.86
0.85
0.58
0.57
0.64
0.98
1.09
0.92
0.78
1.24
1.18
0.71
0.98
0.68
1.18
1.36
0.78
1.64