Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Si decides imprimirlo, por favor hazlo en papel reciclado, a doble cara y con poca tinta. S ecolgico. Muchas gracias.
!nferencia Estad"stica
!n English
Probabilidad de sucesos
E ercicio #ps E ercicio $ps E ercicio %ps
Estimacin puntual
Propiedades de estad"sticos y estimadores &esperanza, varianza, eficiencia, consistencia...' E ercicio #ep(p E ercicio $ep(p E ercicio %ep(p E ercicio )ep(p Mtodos &m*ima verosimilitud y momentos' E ercicio #ep(m E ercicio $ep(m E ercicio %ep(m E ercicio )ep(m E ercicio +ep(m E ercicio ,ep(m
!ntervalos de confianza
E ercicio #ic Poblaciones normales &cual-uier tama.o muestral, intervalos e*actos' E ercicio #ic(e E ercicio $ic(e E ercicio %ic(e E ercicio )ic(e /uales-uier poblaciones &tama.o muestral grande, intervalos asintticos' E ercicio #ic(a 0ama.o muestral m"nimo E ercicio #ic(t
/ontrastes de hiptesis
E ercicio #ch /ontrastes paramtricos E ercicio #ch(p E ercicio $ch(p E ercicio %ch(p /ontrastes no paramtricos E ercicio #ch(np
1eferencias
Probabilidad de sucesos
Ejercicio 1ps
Supn que diriges un banco donde las cantidades de depsitos y reintegros diarios estn dados por variables aleatorias independientes con distribucin normal. Para los depsitos, la media es $12.000 y la desviacin estndar es $4.000 para los reintegros, la media es $10.000 y la desviacin estndar es $!.000. "a# Para una semana, calcular o acotar la probabilidad de que los cinco reintegros sumen ms de $!!.000 "b# Para un d$a particular, calcular o acotar la probabilidad de que los reintegros e%cedan a los depsitos en ms de $!.000 &magina que vais a lan'ar un nuevo producto mensual. (l estudio prospectivo indica que los bene)icios "en millones de dlares# se comportan como la cantidad aleatoria * + ",-1#.2,/2!, donde , sigue una distribucin t de Student con veinte grados de libertad. "c# Para un mes particular, calcular o acotar la probabilidad de que los bene)icios sean menores a uno "un milln de dlares#.
&5a mitad del enunciado de este e ercicio ha sido tomada del libro 0usiness Statistics, 6ouglas 6o7ning y 8effrey /lar9, :arron;s.'
$ 3 2 ( 3 =#=.=== , $ 3 = +.=== )
donde 1 y 3 representan las variables aleatorias depsitos diarios and reintegros diarios, respectivamente. &Para evitar posibles malentendidos futuros, desde el principio escribimos las varianzas 4no las desviaciones estndar4 en las e*presiones de las distribuciones.'
(a) /omo las variables son diarias, para una semana tenemos cinco medidas de ellas &una por cada d"a
laborable'. 0raduccin al lengua e matemtico< Se nos pregunta por la probabilidad P ( 3 #+ 3 $+ 3 %+ 3 )+ 3 + > ++.=== )= P ( i=# 3 i > ++.=== ) :>s-ueda de una distribucin conocida< Para calcular o acotar esta probabilidad, necesitamos conocer la distribucin de la suma o, alternativamente, relacionarla con una cantidad cuya distribucin conozcamos. ?tilizando las reglas -ue gobiernan las sumas y restas de variables normales,
+
i=# 3 i 2 (+ 3 , + $ 3).
1eescritura del suceso< Podemos reescribir fcilmente el suceso en trminos de la versin estandarizada de esta distribucin normal< P ( i=# 3 i> ++.=== )= P
+
=P 4 >
/onsulta de la tabla< Ainalmente, es suficiente consultar la tabla de la distribucin normal estndar de 4. Por un lado, en la tabla nos proporcionan valores para los cuantiles =,)) y =,)+, por lo -ue podr"amos redondear el valor =,))@$ al ms cercado, =,)+, o, ms e*actamente, vamos a acotar la probabilidad. Por otro lado, la tabla incluye las probabilidades de las colas inferiores, por lo -ue consideraremos el complementario de algunos sucesos. B partir de un dibu o de la funcin de densidad y los valores, es fcil deducir -ue
+ i= #
Cota< Es tambin posible relacionar la suma con la media muestral, y utilizar su distribucin
$ # + 3 = i=# 3 i 2 (3 , 3 ) + +
3 3
3 +
2 (=,# ) .
( 3 1 )( $.===)
@#=% > = P (4 > )= P ( 4 > #,=F%$ ) $+ + #,#=% $+#=, + #,#=, $+#= ,+ #,#= , +.===($.=== )
( $,%$+
) ( $,%$+ )
:>s-ueda de una distribucin conocida< Co conocemos la distribucin de &,-1'.2,/2!, pero sabemos -ue , t $= 1eescritura del suceso< Podemos reescribir fcilmente el suceso en trminos de esa distribucin conocida< P ,+# < #) = P ( , + # < $,%$+ )= P ( , < $,%$+ #)= P ( , < #,%$+ ) ( $,%$+
/onsulta de la tabla< Ainalmente, es suficiente consultar la tabla de la distribucin t de Student. 5a cantidad #,%$+ est en la tabla, y nuestra tabla proporciona las probabilidades de las colas inferiores, por lo -ue
E ercicios y problemas resueltos de !nferencia Estad"stica 4 %
Ejercicio 2ps
5uando un proceso de produccin est )uncionando correctamente, la resistencia "en o6mnios# de los componentes que produce sigue una distribucin normal con desviacin t$pica 4,78. Se toma una muestra aleatoria simple de cuatro componentes. 95ul es la probabilidad de que la cuasivarian'a muestral sea mayor que /0: Hariable ; I 1esistencia &de un componente' Muestra y estad"stico ;#, ;$, ;%, ;) &Se mide la resistencia en cuatro componentes distintos.' S 2= Suceso y probabilidad 5a probabilidad por la -ue nos preguntan es
n 1 )2 ( Ri R i = 1 n 1
; J C&K, L M ),,G'
/uasivarianza muestral
P ( S 2> 30)
Para calcular la probabilidad de un suceso, tenemos -ue conocer la distribucin de la variable aleatoria involucrada. En este caso no conocemos la distribucin de S 2 , aun-ue sabemos -ue como ; sigue una distribucin normal< ( n 1 ) S 2 2 n 1 2 Entonces, dado -ue n M ) y completando la desigualdad con las constantes necesarias< ( n1 ) S 2 ( n 1) 30 ( 4 1 ) 30 P ( S > 30)= P > = P > = P (> 4,11 ) 2 2 4,682
2
) (
donde 2 3 . Por tanto, vemos -ue la idea importante del e<ercicio es escribir el suceso que nos piden y operar para conseguir una cantidad en la que apare'ca la cuasivarian'a y cuya distribucin sea conocida. 0abla de la distribucin i(cuadrado /omo n4#M)4#M%, es suficiente mirar la tercera fila.
2 5as probabilidades de la tabla corresponden a sucesos de la forma P X 2 p , &o P X p , dado -ue la distribucin es continua', as" -ue hay -ue considerar el complementario<
Ejercicio 3ps
5alcular las siguientes probabilidades= "a# P&, + !', donde , sigue una distribucin binomial con parmetros 10 y 0,2. 0usca el valor en la tabla y comprueba que es correcto utili'ando la )uncin de masa de la distribucin. "b# P&, > 2', donde , sigue una distribucin de Poisson con parmetro ? + 2,@. 9(s ms )cil considerar el suceso complementario:
(a) Si la tabla -ue ests utilizando da probabilidades individuales P& , M %', basta buscar la probabilidad -ue
corresponde a los valores de los parmetros A M #= y p M =,$< P&, + !' M =,=$,). Si la tabla da probabilidades acumuladas P&, N %', debe reescribirse el suceso como { , =+ }={ , + }{ , ) } , por lo -ue P ( , =+)= P ( , +) P ( , ) )= =,=%$G=,==,) ==,=$,) . Si no tuvisemos ninguna tabla, podr"amos aplicar la definicin de la funcin de masa< P ( , =+)= ) (+ )= #= =.$+ ( # =.$ )#=+= $+$=,#, +==,=$,) . + (b) Si la tabla proporciona las probabilidades acumuladas de las colas inferiores P&, N %', debe considerarse el complementario del suceso< { , > $ }={ , $ }c , de donde
( )
Estimacin puntual
Propiedades de estadsticos y estimadores
Ejercicio 1ep-p
Para estudiar una poblacin, consideramos un estad$stico B que utili'a la in)ormacin contenida en la muestra aleatoria simple X + ",1, ,2,...,,n#, donde el modelo poblacional , sigue una distribucin <iC cuadrado con tres grados de libertad. Si # , B ( X )=B ( , # , , $, ... , , n)=$ , calcular su esperan'a y su varian'a. 5omo estimador del doble de la media de la ley poblacional, 9es B un estimador consistente en media cuadrtica: 5alcular el error cuadrtico medio de B.
Pista= Si , sigue una distribucin <iCcuadrado con m grados de libertad, E",# + m y Dar",# + 2m.
Para calcular el valor de estas dos propiedades de la distribucin en el muestreo del estad"stico B, tenemos -ue aplicar las propiedades de la esperanza y de la varianza de las distribuciones de probabilidad. El conocimiento sobre la distribucin de , se utiliza en los >ltimos pasos. Esperanza< E ( B ( X )) = E $ =
([
# n $ n , # = E E , E ( #)= $ i n i=# n i= # i n
] ) (
n i=#
, i #
$ n $ E ( , i )#= n E ( , )#=$%# =+ i = # n n
Harianza< Dar ( B ( X )) =Dar $ = /onsistencia< Bun-ue la varianza de B tiende a cero cuando n crece, la esperanza de B no tiende a $ E ( , ) . Entonces, B no es un estimador consistente en media cuadrtica del doble de la media de la distribucin poblacional . B partir de esta informacin &par de condiciones', no se puede decir nada sobre la consistencia en media de orden # y la consistencia en probabilidadO estos tipos de consistencia deben ser estudiados por un camino diferente. Error cuadrtico medio< /omo b ( B )= E ( B )$ E ( , )=(+ $% )$=# , ES( ( B )=#+ Podemos ver -ue ES( ( B ) # cuando n . $) . n
([
# n $ n $ , # = Dar ,i = Dar i i = # i = # n n n
] ) (
)()
i =#
,i =
n ) Dar ( , i) n $ i= #
) ) $) n Dar ( , )= $%= $ n n n
Ejercicio 2ep-p
Fna muestra aleatoria simple de tamaGo n es e%tra$da de una poblacin normal. Ha media I puede estimarse con ,. Probar que este estimador es e)iciente. Es necesario probar -ue se verifica la definicin de e)icacia< Definicin &a' 5a esperanza de P es K, esto es, P es insesgado &b' P tiene m"nima varianza, lo -ue sucede 4debido a un resultado terico4 cuando Dar&P' alcanza la cota m"nima terica de /ramr(1ao # nE
[(
log [ ) ( , )]
)]
$
o, ba o condiciones de regularidad#, nE
$ log [ ) ( , )] $
donde ) ( % ) es la funcin de probabilidad de la ley poblacional &en este caso Q M K', y en ) ( , ) la variable no aleatoria % se sustituye por la variable aleatoria , &en otro caso, no es posible hablar de esperanza...'.
#
. Es necesario -ue log [ ) ( % )] sea dos veces diferenciable con respecto a Q. En lo concerniente a las condiciones de regularidad, la Ri9ipedia refiere &http<SSen.7i9ipedia.orgS7i9iSAisherTinformation' a la ec. &$.+.#,'. de
5ehmann, E. 5. and U. /asella &#FFG'. B6eory o) Point (stimation. Springer. $nd ed. !S:C =(%G@(FG+=$(,.
(a) 5a esperanza de la media muestral siempre es 4para cual-uier poblacin4 la media poblacional. Sin
embargo, podemos hacer los clculos de nuevo<
n )= E # i=# , i = # E E(, n n
n i =#
,i =
# n # E ( , i ) = n E ( , ) = E ( , ) = i = # n n
(b) 5a varianza de la media muestral siempre es 4para cual-uier poblacin4 la varianza poblacional dividida
por n. Sin embargo, podemos hacer de nuevo los clculos<
n )=Dar # , i = # Dar Dar ( , n i= # n
)()
n i= #
,i =
# n # $ Dar , = n Dar ( , ) = ( ) i n n $ i= # n$
Por otro lado, calculamos la cota m"nima terica de /ramr(1ao paso a paso< &#' Auncin
# ) ( , )= e $ ( , ) $ $
$
( , ) $ $
( , )$ )=log ( $ ) $ $
&%' 6erivada parcial del logaritmo de la funcin< ( log [ ) ( , )]) = = # $ ( , )(# )= , $ $ $ &)' Esperanza del cuadrado de la derivada parcial del logaritmo de la funcin< E
[(
log [ ) ( , )]
) ]= E[(
$
, $ #
)]
$
$ # # # # E [ ( , ) ] = ) Dar ( , )= ) $= $ )
nE
[(
log [ ) ( , )]
)]
$
$ # = # n n $
5a varianza del estimador alcanza &es igual a' la cotaO entonces, el estimador tiene varianza m"nima y &b' -uda probada. El cumplimiento de &a' y &b' implica -ue ! es un estimador eficiente de ".
Cota< Supongamos -ue se puede aplicar la segunda e*presin de la cota de /ramr(1ao &vlida ba o ciertas condiciones de regularidad'O entonces, el paso &%' ser"a
$ ( log [ ) ( , )] ) = , = # (#)= # $ $ $ $
el paso &)' ser"a
E
y, finalmente, el paso &+' ser"a
$ log [ ) ( , )] # # = E $ = $ $ #
] [ ] ]
=
nE
log [ ) ( , )] $
$ # = # n n $
6e este modo, habr"amos obtenido el mismo resultado con clculos ms fciles, aun-ue el cumplimiento de las condiciones de regularidad debe verificarse antes...
Ejercicio 3ep-p
Para estudiar la media de una poblacin, es decir, I + E",#, se considera una muestra aleatoria simple de tamaGo n. 2o con)iamos en los datos primero y Jltimo, por lo que estamos interesados en el estad$stico
B ( X )= B ( , # ,
, , n) =
n# , $+ , % +!+ , n# # # , = ( , + , +!+ , ) = i $ % n # n $ i =$ n $ n $
5alcular la esperan'a y la varian'a del estad$stico. 5alcular tambiKn el l$mite cuando n tiende a in)inito. 6eben aplicarse las propiedades bsicas de la media y la esperanza< # # # ( , + , +!+ , ) )= E ( , )+!+ E ( , ) ) = ( n $ )= ( ( n $ n $ n $ # # # Dar ( B ( X ) ) =Dar ( ( , + , +!+ , ) )= Dar ( , )= ( n $ ) = n $ n $ ( n $) ( n $ ) E ( B ( X )) = E
$ % n# $ n #
n # i=$ $ $ $ % n# $ i $
/uando n crece mucho, esto es, cuando la muestra tiene cada vez ms informacin, los l"mites son
lim n E ( B ( X ) ) =lim n =
Esto muestra -ue B&X' tiene algunas propiedades deseables< insesgadez y varianza evanescente, par -ue es e-uivalente a la evanescencia del error cuadrtico medio, -ue implica la consistencia &en probabilidad'.
Cota< 6e hecho, el estimador del enunciado is la media muestral usual cuando la muestra tiene n4$ datos, en vez de n. /uando alguno de los dos datos -uitados no es confiable, tiene sentido utilizar este estimadorO en otro caso, no e*plota la informacin disponible de forma ptima. Por otro lado, la media muestral puede verse afectada por valures muy grandes o muy pe-ue.os & at$picos'. Para hacer robusta a la media muestral, a veces se considera el estimador estudiado despus de ordenar los datos &de menor a mayor o viceversa'O si ,&i' es el i(simo dato de la muestra reordenada<
" ( X )= B ( , # , B
, , n) =
n# # # , = ( , + , ( %) +!+ , ( n#) ) n $ i =$ (i ) n $ ( $)
Este nuevo estimador robusto de la media poblacional se llama media muestral truncada, y cual-uier proporcin de datos puede de arse fuera &en vez de dos'.
Ejercicio #ep-p
Suponga que la altura de cada estudiante sigue una distribucin normal con varian'a !! cent$metros. Si se considera una muestra aleatoria simple de 2! estudiantes, calcular la probabilidad de que la cuasivarian'a muestral sea mayor a 74,72!. 5a variable principal es la altura, la distribucin poblacional es la normal, el tama.o muestral es $+ &menor a treinta', y se nos pregunta por la probabilidad de un evento e*presado en trminos de un estad"stico< $ P ( S > ,),,$+ ) . /omo no conocemos la distribucin en el muestreo de S$, no podemos calcular esta probabilidad directamente. En su lugar, nada ms leer Vcuasivarianza muestralW deber"amos pensar en el resultado terico ( n # ) S $ $ n # . $ Para aplicarlo, el suceso debe reescribirse completando algunos trminos. Bdems, cuando la tabla de la distribucin i(cuadrado da la probabilidades de las colas inferiores P& , N %', es necesario considerar el suceso complementario< P ( S $ > ,),,$+ )= P
$%todos
Ejercicio 1ep-m
Fna poblacin es representada por una variable aleatoria que sigue una distribucin de Poisson. 1ada una muestra aleatoria simple de tamaGo n, aplicar el mKtodo de m%ima verosimilitud para encontrar un estimador del parmetro L. &#' Auncin de probabilidad< Para una variable aleatoria de Poisson &Q X =', ) ( % )= e , %M &$' Auncin de verosimilitud< H ( % #, % $,... , % n )=$i =# ) ( % i )=$i =# &%' 5ogaritmo de la funcin de verosimilitud< log [ H ( % #, % $,... , % n )]=log [
i= # % i
n
% #{=, #, $... }
e= e e ! e= en . n %i M %# M %$ M %n M $i=# % i M
%i
%#
%$
%n
i=# %i
&)' M*imo del logaritmo de la funcin de verosimilitud< 5a distribucin poblacional tiene slo un parmetro, por lo -ue es necesario ma*imizar una funcin de una variable. Para encontrar los VcandidatosW &valores e*tremos locales'< n # # n = = log [ H ( % #, % $,... , % n )]=( i=# % i ) n E = = i=# % i = %. n Para verificar -ue el candidato es un m*imo &local'< $ log [ H ( % % , % )]=( n % ) # < = i =# i $ #, $,... n $ dado -ue % #{=, #, $... } E i=# % i %= . Entonces, la segunda derivada is siempre negativa< tambin para = . Sin embargo, si sustituimos el candidato en la derivada &% M = solo para una Vmuestra muy e*tra.aW'<
n # # # n n ( i=# % i ) $ = n % $= < =. n % ( %) ( %) n
&+' Estimador por el mtodo de m*ima verosimilitud< Se obtiene despus de sustituir las letras min>sculas %i &n>meros -ue representan 5B muestra -ue tenemos' por letras may>sculas ,i &variables aleatorias -ue representan /?B5Y?!E1 posible muestra -ue podamos tener'< & EH= # , i = , . n i= #
n
Ejercicio 2ep-m
Fna variable aleatoria poblacional tiene la )uncin de densidad &L > =' ) ( % )=
$ ( % ) $ =
= % Nt6erOise
1ada una muestra aleatoria simple de tamaGo n, aplicar el mKtodo de los momentos para encontrar un estimador de L. &#' Momentos poblacionales centrados y momentos muestrales< 5a distribucin poblacional tiene slo un parmetro, por lo -ue slo se igualarn los primeros momentos. '# ()= E ( , )=( % ) ( % ) d% =(= %
+
$ ( % ) $ d% = $ $
( (= % d% (= % $ d% )
$ % $ % % $ # # = $ [ [= = $ = $ = = $ % $ % , %
) (
a # ( % # , % $ , ... , % n )=
# n % n i=# i
&%' Estimador por el mtodo de los momentos< Se obtiene despus de sustituir las letras min>sculas %i &n>meros -ue representan 5B muestra -ue tenemos' por letras may>sculas ,i &variables aleatorias -ue representan /?B5Y?!E1 posible muestra -ue podamos tener'< & EE = % , i=% , . n i=#
n
Ejercicio 3ep-m
1ada una poblacin, se estudia una variable aleatoria con )uncin de densidad &distribucin e%ponencial' ) ( % )=
e % % %= = %< =
Para una muestra aleatoria simple de tamaGo n, aplicar tanto el mKtodo de m%ima verosimilitud como el mKtodo de los momentos para encontrar un estimador del parmetro L. Mtodo de m*ima verosimilitud &#' Auncin de probabilidad< 5a funcin de densidad est dada en el enunciado.
E ercicios y problemas resueltos de !nferencia Estad"stica 4 #=
&$' Auncin de verosimilitud< H ( % #, % $,... , % n )=$i =# ) ( % i &%' 5ogaritmo de la funcin de verosimilitud< log [ H ( % #, % $,... , % n )]=log [ ]+ log [ e &)' M*imo del logaritmo de la funcin de verosimilitud<
n i =# % i
n
)=$i =# ( e % ) =n e
i
n i= #
%i
]= n log [ ] i=# %i
5a distribucin poblacional tiene slo un parmetro, por lo -ue es necesario ma*imizar una funcin de una variable. Para encontrar los valores e*tremos locales &% M = slo para una Vmuestra muy e*tra.aW', la condicin necesaria es<
n # = = log [ H ( % #, % $,... , % n )]=n i=# % i E = =
i=# % i
# # % n i =# i
n
# %
Por tanto, la segunda derivada es siempre negativa< tambin para = . &+' Estimador por el mtodo de m*ima verosimilitud< Se obtiene despus de sustituir las letras min>sculas %i &n>meros -ue representan 5B muestra -ue tenemos' por letras may>sculas ,i &variables aleatorias -ue representan /?B5Y?!E1 posible muestra -ue podamos tener'< & EH= n = # . ,
i=# , i
Mtodo de los momentos &#' Momentos poblacionales centrados y momentos muestrales< 5a distribucin poblacional tiene slo un parmetro, por lo -ue se igualarn slo los primeros momentos. '# ()= E ( , )=( % ) ( % ) d% =(= % e % d% = %
+ # + % # % [= e (= e d% # % + # % = # # = % e % [+ e [= = % e % [= e [ + =( = = )+ ( = )= = + + + + +
donde esta integral definida ha sido resuelta por la regla de integracin por partes, dado -ue en el producto las funciones % y e % Vno son del mismo tipoW &una es un polinomio y otra una e*ponencial'<
( u ( % )v P ( % ) d% =u ( % )v ( % )( u P ( % )v ( % ) d%
con ) ) u=% E v P =e % E u P = v =( e % d% = # % e
a # ( % # , % $ , ... , % n )=
# n % n i=# i # # n = % n i= # i n # # % n i =# i
n
= =
i=# % i
n =
# %
i=# , i
# . ,
Ejercicio #ep-m
Fna variable aletoria poblacional sigue una distribucin normal. Para encontrar un estimador de los parmetros L + &I,Q' a partir de una muestra aleatoria simple de tamaGo n, aplicar= "a# el mKtodo de m%ima verosimilitud Mtodo de m*ima verosimilitud &#' Auncin de probabilidad< 5a funcin de densidad es bien conocida<
# ) ( % , )= e $ ( % ) $ $
$
&$' Auncin de verosimilitud< H ( % #, % $,... , % n , )=$i=# ) ( % i , )=$i=# &%' 5ogaritmo de la funcin de verosimilitud< log [ H ( % #, % $,... , % n , )]=n log [ $ ] &)' M*imo del logaritmo de la funcin de verosimilitud< 5a distribucin poblacional tiene dos parmetros, por lo -ue is necesario ma*imizar una funcin de dos variables. Para encontrar los valores e*tremos locales, las condiciones necesarias son<
n # ( % i )$ $ i= # $ n n
# e $
( % i ) $
$
)( )
# = $
n $ n # ( % i ) $ i =# $
( )
{
0=
# n % n i =# i
# n $= i =# ( % i)$ n
$=
# (% % )$ = s$ % n i =# i
n
= %
= % = s %
Para verificar -ue el candidato es un m*imo &local', las condiciones suficientes sobre las derivadas parciales de segundo orden son<
$ n n # # n R= $ log [ H ( % #,... , % n , )]= ( % ) = (# )= $ i $ $ i =# i= # n n $ n $ $ log [ H ( % , % , )]= # ( % ) = ( % )= ( % i) , #,... n i i $ ) % i= # i= # i= #
n < = s$ %
$ n 0*( , s )= % i=# ( % i % )= = s%
%
&
1*( = %,s )
$ %
( )( )
n $n $n $ = < = $ ) s$ s s % % %
5*( % , s )=
%
n % n $n ) i=# ( %i )$= $ $ s% s % s%
n
dado -ue
% )== i=# ( % i
$ $ $ % ) = i=# ( %i % ) =n s % . i=# ( % i n
% , s % ) por-ue es un valor e*tremos local y, en ese punto, 1 Z = y R Z =. tiene un m*imo en ( , )=( &+' Estimador de m*ima verosimilitud< Se obtiene despus de sustituir las letras min>sculas %i &n>meros -ue representan 5B muestra -ue tenemos' por letras may>sculas ,i &variables aleatorias -ue representan /?B5Y?!E1 posible muestra -ue podamos tener'< & EH= , & EH= & EH = s , Mtodo de los momentos &#' Momentos poblacionales centrados y momentos muestrales< 5a poblacin tiene dos parmetros, por lo -ue se igualarn los dos primeros momentos. '# ( , )= E ( , )= a # ( % # , % $ , ... , % n )= # n % n i=# i ' $ ( , )= E ( , $ )=Dar ( , )+ E ( , )$= $+ $ a $ ( % # , % $ , ... , % n )= # n $ % n i=# i
# n % % = n i= # i # n $+ $ = i=# % $ i n =
= % $= % ) % =s (# n
n i= # $ i $ $ %
Ejercicio 'ep-m
&magina que la variable poblacional en la que estamos interesados sigue una distribucin binomial, esto es, tiene una )uncin de masa dada por ) ( % A , p )= A p % ( # p ) A % %
()
()
[ $ ( )]
n i= #
A %i
i=# %i
(# p )
nA i = # % i
&$' 5ogaritmo de la funcin de verosimilitud< log [ H ( % #, % $,... , % n A , p )]=log ( R)+ log ( p ) i=# % i + log ( # p )( nA i =# % i) .
n n
&%' M*imo del logaritmo de la funcin de verosimilitud< Para encontrar los VcandidatosW &valores e*tremos'<
n n # n # # p n = = log [ H ( % #, % $,... , % n A , p )]== + i=# % i ( nA i=# % i ) E % = nA % i i= # i=# i p p # p p
# # = p
nA
i=# % i
# E p ==
## n # % i= % i = # A n A
dado -ue % #{=, #, $,... , A } E nA i=# %i %= . Entonces, la segunda derivada es siempre negativa. &)' Estimador m*imo(veros"mil<
E ercicios y problemas resueltos de !nferencia Estad"stica 4 #)
& EH= # , . A
Ejercicio (ep-m
Ha distribucin uni)orme F20,Q3 tiene # ) ( % ) = =
i) % #[ =, ] ot6erOise
como )uncin de densidad. Rplicar el mKtodo de los momentos para obtener un estimador de L. &#' Momentos poblacionales centrados y momentos muestrales<
+ # # %$ # $ '# ()= E ( , )=( % ) ( % ) d% =(= % d% = [ == $ =$ . $
=# n % $ n i =# i
= =
$ n % =$ % n i=# i
nter)alos de confian*a
Ejercicio 1ic
Rplicar el mKtodo de la cantidad pivotal para obtener los siguientes intervalos de con)ian'a= "a# "b# "c# "d# "e# ")# "g# "6# "i# "<# "A# Fna poblacin normal= para I cuando Q es conocida Fna poblacin normal= para I cuando Q es desconocida Fna poblacin normal= para Q cuando I es conocida Fna poblacin normal= para Q cuando I es desconocida 1os poblaciones normales &independientes'= para I%S Iy cuando Q% y Qy son conocidas 1os poblaciones normales &independientes'= para I%S Iy cuando Q% y Qy son desconocidas e iguales 1os poblaciones normales &independientes'= para Q% .Qy cuando I% y Iy son desconocidas Fna poblacin cualquiera= para I 1os poblaciones &independientes' cualesquiera= para I%S Iy Fna poblacin de 0ernouilli= para p 1os poblaciones de 0ernouilli &independientes'= para p%Spy ,
n
E ercicios y problemas resueltos de !nferencia Estad"stica 4 #+
, < + ' ) '+ $ < + ' ' +$ = P (' '+$ n < , n n ' ' + $ < < , + ' ' + $ )= P ( , + ' + ' + $ > > , ' '+ $ ) = P ( , n n n n ' '+ $ < < , + ' '+ $ ) =P ( , n n , t n # , por lo -ue S n
(b) El pivote es B ( X )=
t ' +$ = P ( ,
t ' + $ =P ( ,
(c) El pivote es B ( X )=
i=# ( , i)$
$
=i=#
, i $ n , por lo -ue
n
i=# ( , i)$
$
< '+ $
)
$
#'+ $
) (
)
i=# ( , i)$
'+ $
<<
i=# ( , i)$
#' + $
n s $ ( n # ) S $ $ (d) El pivote es B ( X )= $ = n # , por lo -ue $ #'= P ( a#'+ $< B ( X )< a ' +$ )= P #' + $<
) (
) (
(e) El pivote es B ( X , Y , T )=
T )( , T ) (,
, T + n , nT
T )( , T ) (,
$ $ , + T n , nT
= P ' ' +$
T ) ' ' + $ = P ( ,
T )+ ' ' +$ =P ( ,
T ) ' ' +$ =P ( ,
( ( (
) )
(f) El pivote es B ( X , Y , , T )=
$ , $ T
T )( , T ) (,
(
S
$ p $ ,
# # + n , nT
tn
+ nT $
T )( , T ) (,
= P t ' + $ S $ p
T )t ' + $ S $ =!= P ( , p
( ( ) ( (
( ) ( )) (
S
$ p
# # + n , nT
< + t '+ $
)
))
(+) El pivote es B ( X , Y , , T )=
S , T
$ $ , ST
Un
# , nT #
, por lo -ue
$ S$ , T $ $ , ST
) (
S$ T S$ ,
<
$ T $ ,
< ) '+$
$ ST
S$ ,
=!= P
(,) El pivote es B ( X )=
2 ( =,#) , por lo -ue cuando n X %= se puede aplicar el intervalo $ n obtenido en &a' a cual-uier poblacin. Bdems, si L$ es desconocida y n X #== cual-uiera de s$ S$ puede utilizarse en su lugar.
(i) El pivote es B ( X , Y , , T )=
2 ( =,# ) , por lo -ue cuando n, X %= y nT X %= se $ $ , + T n , nT puede aplicar el intervalo obtenido en &e' a dos poblaciones &independientes' cuales-uiera. Bdems, si LP$ y
T )( , T ) (,
LD$ son desconocidas y n, X #== y nT X #==, sus estimadores muestrales pueden utilizarse en su lugar.
(j) El pivote es B ( X p )=
)
2 ( =,#) , por lo -ue
(-) El pivote es B ( X , Y p , , pT )=
(& p , & pT )( p , p T )
(p & ,p & T )( p , pT )
p , (# & & p,) & p (# & pT ) + T < ( p , pT )< ( & p , & pT )+ ' ' +$ n, nT
Poblaciones normales
Ejercicio 1ic-e
Para estimar la altura media de los rboles de un bosque, se considera una muestra aleatoria simple con 20 elementos, proporcionando % =#),@= u and s =,,%) u , donde u denota una unidad de longitud y s$ es la cuasivarian'a muestral. Si se supone que la variable poblacional altura es normal, encuentra un intervalo de con)ian'a del V! por ciento. 95ul es el margen de error: B partir de la informacin del enunciado, sabemos -ue la variable se distribuye normalmente y tiene varianza desconocida. El tama.o muestral es n M $= &menor a %=, por lo -ue ning>n resultado asinttico podr"a ser utilizado'. Para aplicar el mtodo de la cantidad pivotal, necesitamos un pivote con distribucin conocida, fcil de manipular y con K involucrado en su e*presin. /onsultando una tabla de estad"sticos &p.e . en 2$3', B ( X , )= ,
S$ n
t n#
donde X =( , # , , $ , ... , , n) es una muestra aleatoria simple, S$ es la cuasivarianza muestral y t9 denota la distribucin t de Student con A grados de libertad &en otras e*presiones tp es el cuantil de probabilidad p', el intervalo se construye como sigue
t '+$ = P ( , t '+ $ =P ( ,
S + t '+ $ S )= P ( , + t ' +$ S > > , t '+ $ S ) < < , n n n n E t ' +$ S , , + t' + $ S &= , n n
-t ' +$ S = , n #'
Para utilizar esta frmula general con los datos espec"ficos -ue tenemos, se necesitan los cuantiles de la distribucin con A M n4# M $=4# M #F grados de libertad F+\ E =,F+ M #4[ E [ M =,=+ En la tabla de la distribucin t, debemos buscar el cuantil dado para p M #4[][S$ M #4[S$ M =,F@+ para una tabla de probabilidades de colas inferiores, o p M [S$ M =,=$+ para una tabla de probabilidades de cola superiorO si se utiliza una tabla de dos colas, debe considerarse el cuantil dado para p M #4[ M =,F+=. /ual-uiera -ue sea la tabla utilizada, el cuantil es $,=F%. Ainalmente,
& == % -t =,=+ +$ s u =#),@= u -$,=F% ,,%) =#),@= u -$,F@ u $= $=
Ejercicio 2ic-e
(l n>mero de unidades demandadas de un producto se modeli'a, para dos reas di)erentes e independientes R y 0, por las distribuciones 2&IR,Q2' y 2&I0,Q2', respectivamente. Para estudiar la di)erencia entre las medias, se consideran las siguientes muestras aleatorias simples Area A Area B 4 @ @ 4 8 @ 7 @ @ 8
(ncontrar un intervalo de con)ian'a VV por ciento. 95ul es el margen de error: Eleccin del pivote adecuado< ^ay dos poblaciones normales independientes, estamos interesados en IRSI0 y las varianzas son desconocidas pero iguales. Entonces, a partir de una tabla de estad"sticos &p.e . en 2$3', se selecciona el pivote T )( , T ) (, B ( X , Y , , T )= t n + n $ , # # S$ + p n , nT
S$ %=
$ $ + # $ ( ) ,) + !+ ( G, ) ( % , ) = =%,+ + # i=# i )
por lo -ue S $ p= )
++ + $,
= t G,=,==+=%,%++.
# # # + ) , ( , @ )+ %,%++ $( + ) ] =# -%,==# (# + + ++
# # # # + =%,%++ $ + = %,==# n , nT + +
Ejercicio 3ic-e
Ha nota de una prueba de aptitud sigue una distribucin normal con desviacin t$pica 28,2. Fna muestra aleatoria simple de nueve alumnos proporciona los resultados siguientes=
i=1 x i =1.098
i=1 x 2 i = 138.148
a# Wallar un intervalo de con)ian'a al V0X para la media poblacional I. b# ;a'onar sin 6acer clculos si la longitud de un intervalo al V!X ser menor, mayor o igual que la del obtenido en el apartado anterior. c# 95ul deber$a ser el tamaGo de muestra m$nimo necesario para obtener un intervalo del V0X de nivel de con)ian'a con longitud "entre e%tremos# igual a 10: !dentificar la variable , . Cota &de un alumno' !nformacin muestral Muestra terica &aleatoria'< ,#,..., ,F m.a.s. &se van a tomar las notas de nueve alumnos' Muestra n>merica< %#,..., %F E , J C&K, L$ M $G,$$'
Podemos observar -ue no se conocen los valores %i de la muestra. Sin embargo, se conoce informacin construida a partir de estos valores. 6ebe ser su)iciente para hacer los clculos, -ue deben involucrar a las sumas anteriores.
) ) )
El tama.o muestral, n M F, es pe-ue.o, por lo -ue no se podr"an utilizar las frmulas asintticas Se sabe -ue la variable sigue una distribucin normal Ainalmente, como nos informan del valor de la desviacin t"pica poblacional, no es necesario estimarla
B partir de una tabla de estad"sticos &p.e . En 2$3', se selecciona el estad"stico apropiado y, despus de aplicar el mtodo de la cantidad pivotal &vase E ercicio #ic', concluimos -ue debemos usar la e*presin z ' + 2 < < X + z ' + 2 =1 '=0,90 P X n n donde z /+ 2 es el valor de la distribucin normal estndar -ue verifica P Z z /+ 2 =/+ 2 , es decir, el valor tal -ue de a un rea igual a /+ 2 a la derecha &cola superior'. Hamos a calcular las cantidades -ue aparecen en la frmula< 1 9 1 xi = 1.098=122 i = 1 9 9 0 ?n nivel de confianza del F=\ implica -ue [ M &#==4F='S#== M =,#. El cuantil z ' + 2= z 0,05 se busca en la tabla. /omo la tabla nos informa de las probabilidades de la forma P Z z p , buscamos el valor z p= z 1' + 2= z 10,05= z 0,95=1,645 Entonces z ' + 2=1,645 . 0 Por el enunciado, =28,2 0 Por >ltimo, n M F 0 x= El intervalo es CI 0,1= 1221,65
)
2
)(
Bhora, si L y n permanecen fi os, para estudiar cmo var"a H con [ basta ver cmo var"a el cuantil. Para el intervalo del F+\< ) ) [ M &#==4F+'S#== M =,=+ [ disminuye Bhora la cantidad z /+ 2 debe de ar menos rea &probabilidad' a la derecha z /+ 2 aumenta
Si se tomase un tama.o mayor -ue G,#, se obtendr"a un intervalo de precisin mayorO sin embargo, en la prctica esto tambin implicar"a un mayor gasto econmico.
Ejercicio #ic-e
Para prever la in)lacin en el aGo, se 6a recogido una muestra aleatoria simple
1,!
2,1
1,V
2,/
2,!
/,2
/,0
Si se supone que la variable in)lacin sigue una distribucin normal= "a# Ftili'ando estos datos, construye un intervalo de con)ian'a al VVX para la media de la in)lacin. "b# 5onstruye un intervalo de con)ian'a al V0X para la desviacin t$pica. "c# Hos e%pertos opinan que el intervalo de con)ian'a calculado para la media es demasiado amplio, y desean una longitud total igual a 1,2 puntos. Wallar el nivel de con)ian'a para este nuevo intervalo. !dentificar la variable , . Previsin de la inflacin &de un pa"s' !nformacin muestral Muestra terica< ,#,..., ,@ m.a.s. Muestra n>merica< %#,..., %@ 1,! 2,1 1,V 2,/ 2,! /,2 /,0 En este e ercicio s" conocemos los valores *i de la muestra. ,J_
B partir de una tabla de estad"sticos &p.e . En 2$3', se selecciona el estad"stico apropiado y, despus de aplicar el mtodo de la cantidad pivotal &vase E ercicio #ic', concluimos -ue debemos usar la e*presin t '+2 P X
donde t /+ 2 es el cuantil tal -ue P ( T > t ' + 2)='+ 2 . Hamos a calcular las cantidades en la frmula< 1 7 x =2,35 7 i =1 i 0 El nivel de confianza es FF\, por lo -ue [ M &#==4FF'S#== M =,=#. El cuantil t '+2= t 0,01 +2 =t 0,005 se encuentra en la tabla de la distribucin t@(# de Student. 6ado -ue t p= t 1'+ 2=t 10,005=t 0,995=3,71 , entonces t ' +2= 3,71 7 1 2 2 2 ( xi x ) =0,6 =0,36 0 ?tilizando la muestra, S = i = 1 7 1 0 Por >ltimo, n M @ 0 x= El intervalo es CI 0,01= 2,353,71
el mtodo de la cantidad pivotal &vase E ercicio #ic' y tomando la ra"z cuadrada, concluimos -ue debemos usar la e*presin P
( n 1 ) S 2 ( n1 ) S 2 =1 '=0,90 2 2 p p
b a
2 2 donde p y p son valores de la distribucin i(cuadrado, con parmetro n4# M @4# M ,, tales -ue
a b
2 tal -ue p
a
P , 2 p =/+ 2
a
2 p tal -ue
b
P , 2 p =/+ 2
b
El intervalo es CI 0,1=
60,36 , 12,6
60,36 1,64
)(
donde H est dada y debe encontrarse [. Sin embargo, previamente es necesario encontrar t /+ 2 . t ' + 2= L n 1 7 = = 2,2. 2 S 20,6
B partir de la tabla, [S$ M =,#= por lo -ue [ M =,$= y el nivel de confianza en tanto por ciento es< #== 4 =,$= ` #== M #== 4 $= M ./0.
1uales2uier poblaciones
Ejercicio 1ic-a
Ha duracin media de prKstamos en la biblioteca de una universidad en el curso pasado )ue de veinte d$as. Se toma una muestra aleatoria simple de cien libros este aGo, y se obtienen unos valores de diecioc6o y oc6o d$as para la media y varian'a muestrales, respectivamente. 5onstruir un intervalo de con)ian'a del VVX para la duracin media de prKstamos en el curso pasado. !dentificamos la variable , . 6uracin &de un prstamo' !nformacin muestral Muestra terica< ,#,...,,#== m.a.s.
E ercicios y problemas resueltos de !nferencia Estad"stica 4 $%
,J_
x =18 ,
s 2=8
5os valores %i de la muestra son desconocidos. B cambio, se conoce la evaluacin de algunos estad"sticos. y S2. asta debe ser su)iciente para hacer los clculos, y las frmulas deben escribirse en trminos de X !ntervalo de confianza Para elegir la frmula adecuada con -ue calcular el intervalo de confianza, tenemos en cuenta -ue< ) ) El tama.o muestral es grande &X%=', n M #==, por lo -ue se puede utilizar alguna frmula asinttica 5a varianza poblacional es desconocida, pero se estima por la varianza muestral
B partir de una tabla de estad"sticos &p.e . En 2$3', se selecciona el estad"stico apropiado y, aplicando el mtodo de la cantidad pivotal &vase E ercicio #ic' y sustituyendo L por S, concluimos -ue debemos usar la e*presin z'+ 2 P X
donde z ' + 2 es el cuantil tal -ue P ( Z > z ' + 2)='+ 2 . /alculamos las cantidades< x =18 0 Media muestral 0 Para la confianza del FF\, [ M =.=# y z ' + 2=2,575 . x ) =n s , 0 Para calcular S 2 se utiliza la e*presin ( n 1 ) S = i=1 ( x i n 2 100 2 S = s= 8 =8,1 &ntese -ue el factor nS&n4#' tiende a # cuando n crece'. n 1 99 0 Ainalmente, n M #== El intervalo es CI 0,01= 18 2,575
2 100 2 2
Hanse tambin<
E ercicio %ic(e E ercicio )ic(e
1ontrastes de ,iptesis
Ejercicio 1c,
Para contrastar si una moneda es <usta o no, 6a sido lan'ada 100.000 veces, y !0./4@ de ellas 6an sido caras. 91eber$a rec6a'arse, como 6iptesis nula, la <usticia de la moneda cuando Y + 0,1: "a# Rplicar un contraste paramKtrico de signi)icancia. "b# Rplicar el contraste no paramKtrico de bondad de a<uste de <iCcuadrado. "c# Rplicar el contraste no paramKtrico de posicin de los signos.
Ctese -ue la pregunta se basa en el valor del parmetro p, mientras -ue se supone la distribucin de :ernouilli para ambas hiptesisO en algunos contrastes no paramtricos, esta distribucin no se supone incluso. Por otro lado, el nivel [ M =,# est dado. Estad"stico y regin cr"tica< B partir de la tabla de estad"sticos &p.e . en 2$3', dado -ue la variable poblacional es de :ernouilli y el marco asinttico puede aplicarse &por-ue n es grande'
B ( X p )=
/omo la distribucin normal es simtrica, un cuantil determina los dos valores cr"ticos. Para calcular este cuantil, se aplica la definicin de error de tipo !< # '= P ( (rror tipo & )= P ( ;ec6a'ar W = * W = cierta )= P ( B ( X )# ;c * #2= )= P (*B p ( X )*> a * p= ) $ # =# P (*B p ( X )* a * p = ), # P (* 4* a ) E P (*4* a ), #'=#=,# ==,F E a ,#,,)+ $ 1egla de decisin< Si aplicamos la metodolog"a basada en la regin cr"tica, B(x # )= $ +=.%)@ # #==.=== $ = $,#F > #,,)+ E B ( x
0abla de una o dos colas
# )# ;c E 5e rec,a*a W= $
# pD = P ( X tan rec6a'adora como x * W = cierta )= P (* B p ( X )*%*B p ( x )** p = ) $ , P (* 4* %$,#F )= $ P ( 4 $,#F )= $=,=#)% ==,=$)G E pD < =,#=' E 5e rec,a*a W=
0abla de una cola, dado -ue $,#F no est en la tabla de dos colas -ue tenemos
(# $)
W # < , U 1 0ern
(# $)
Estad"stico y regin cr"tica< B partir de la tabla de estad"sticos &p.e . en 2$3', &i )$ d ( 2 i e B ( X )=i=# $ Z s # e &i
Z
con Z + $ clases y celdas Co ha tenido -ue estimarse ning>n parmetro, por lo -ue s M =
Cota< En algunas situaciones, acotar el nivel cr"tico es suficiente para ver si es menor o mayor -ue [ ¶ encontrar la acotacin, se utiliza el valor adecuado ms cercano incluido en la tabla< el menor o el mayor'. Blgunas veces esto no es suficiente y hay -ue calcular el valor e*acto de la probabilidad tericamente o utilizando alg>n programa.
^iptesis y nivel de significancia< El nivel es [ M =,#. Para un contraste no paramtrico, si cara y cru' se escriben e-uivalentemente como ]# y (#, respectivamente, las hiptesis son W = < Ee ( , )= = y W # < Ee ( , )1=
Para calcular el cuantil a, se aplica la definicin de error de tipo !. Sin embargo, conocemos la distribucin de B, pero ;c se ha escrito fcilmente en trminos de B4 nS$, cuya distribucin est involucrada en un resultado asinttico bien conocido &adems, las probabilidades de la binomial no estn tabuladas para n M #==.===' # '= P ( (rror tipo & )= P ( ;ec6a'ar W = * W = cierta )= P B ( X )# ;c B 0in ( n , ) $
(*
P * 4*
$a , #'=# =,#==,F E n
1egla de decisin< Si aplicamos la metodolog"a basada en la regin cr"tica, es necesario evaluar la cantidad en trminos de la cual hemos escrito las regions
=P
(*
B ( X )n + $ B ( x )n + $ % # # # # n (# ) n (# ) $ $ $ $
* *
**
# B ( X ) 0in ( n , ) , P *4*% $
) ( *
*)
1ontrastes param%tricos
Ejercicio 1c,-p
Ha vida media de un mquina, en aGos, sigue una distribucin normal con varian'a igual a 4. Fna muestra aleatoria simple de tamaGo 100 proporciona una media muestral igual a 1,/ aGos. 5ontrastar la 6iptesis nula de que la media poblacional es igual a 1,! aGos, aplicando un contraste bilateral de ! por ciento de nivel de signi)icancia. Civel de significancia y enunciado de las hiptesis< [ M =,=+ y, para un contraste bilateral, W = < = #,+ y W # < 1 #,+
Estad"stico adecuado y regin cr"tica< ^ay una poblacin normal con varianza conocida, por lo -ue el estad"stico incluido aba o es seleccionado. Para determinar la regin cr"tica, ba o W=, son necesarias su forma y los valores cr"ticos. Es muy >til dibu ar el espacio paramtrico y el espacio donde toma valores del estad"stico &si se desea, tambin el espacio donde toma valores el estimador del parmetro'<
B ( X )=
$ n
2 ( =,# )
5os valores cr"ticos (a y ]a &simtricos en este caso, dado -ue tambin lo es la distribucin normal estndar' se encuentran aplicando la definicin de error de tipo !< ' = P ( (rror tipo & ) = P ( ;ec6a'ar W = * W = cierta ) = P ( B ( X )# ;c * #2=) = P (* 4* > a ) E a = ' ' +$=#,F, E ;c = {* B*> #,F, } .
1egla de decisin< Para tomar la decisin final sobre las hiptesis, hay dos metodolog"as disponibles. Para aplicar la primera, se eval>a el estad"stico B en la muestra espec"fica x M &%#,...,%#=='< % % #.+ #.%#.+ =.$#= # B ( x =#.+ )= $ = = = = E B ( x =#,+ )3 ;c E 6o se rec,a*a W= $ $ ) $ ) ) n #== #==
Siempre se calcula la regin cr"tica, por lo -ue aplicar esta metodolog"a es fcil. 5a segunda metodolog"a re-uiere el clculo del nivel cr"tico o p(valor &p(value', -ue es por definicin una probabilidad< pD = P ( X tan rec6a'adora como x * W = cierta )= P (*B ( X )* %*B ( x )** = #,+) = P (*4*%*=,+*)=# P (*4* < =,+ )=# =,%G%== =,,#@ E pD ==,,#@ > =,=+=' E 6o se rec,a*a W= Esta >ltima metodolog"a proporciona la misma decisin final ms informacin adicional sobre el soporte -ue la muestra x ha dado a la hiptesis nula. /omo pD es bastante mayor -ue [, el soporte is fuerte en este caso.
Ejercicio 2c,-p
1ados 2! datos de una poblacin normal, la in)ormacin muestral se resume en
i=# % i=#=+
$+
i=# % $ i = +@F,$)
$+
"a# 91eber$a ser rec6a'ada la 6iptesis W0= Q2 + 4 cuando W1= Q2 X ) y Y + 0,0!: "b# 9T si W1= Q2 c )_
B ( X )=
n s $ ( n # ) S $ $ = n # $ $
El valor cr"tico ]a se calcula aplicando la definicin de error de tipo !< ' = P ( (rror tipo & )= P ( ;e<ect W = * W = true )= P ( B ( X )# ;c * #2=) = P ( $+ #> a ) = # P ($+# a ) E a =%,,) E ;c = {B > %,,) } P ( $ $) a )=#'=# =,=+= =,F+ E
$ $
1egla de decisin< Para tomar la decisin final sobre las hiptesis, hay disponibles dos metodolog"as. Para aplicar la primera, el estad"stico B es evaluado para la muestra espec"fica x< $+ B ( x )=
# # %$ %i i $+ $+ )
) ] = $++,+% =%),+,
$
E B ( x )3 ;c E 6o se rec,a*a W=
Con el cdigo 1pchisq(34.56, 24) en el lengua e de programacin ;, dado -ue el valor %),+, no est en las tablas -ue tenemos.
B ( X )=
n s $ ( n # ) S $ = $ n # $ $
6ado -ue hay infinitos pares de cuantiles tales -ue P ( a #< $ $) < a $)=# ' , se considera por convenio el -ue determina colas de [S$. Entonces ' = P ($ < a ) a =#$,) $) # # $ $ ' = P ( > a ) a =%F,) $) $ $ $
B ( x )= %),+, E B ( x )3 ;c E 6o se rec,a*a W=
Para basar la decisin en el nivel cr"tico o p(valor, dos veces la probabilidad de la cola determinada por B&x'< pD = P ( X tan rec6a'adora como x * W = true )= $P ( B ( X )%B ( x ))= $P ($ $) % %),+,) = $ [ # P ( $ =,=@+==,#+ E pD ==,#+ > =,=+=' E 6o se rec,a*a W= $) < %),+, )]= $
Con el cdigo 1pchisq(34.56, 24) en el lengua e de programacin ;, dado -ue el valor %),+, no est en las tablas -ue tenemos
Cota< 6ados W= y [, se puede llegar a decisiones diferentes para los contrastes unilateral y bilateralO es por esto por lo -ue describir los detalles del entorno de traba o tiene gran importancia en Estad"stica.
Ejercicio 3c,-p
Ha 6omocedasticidad "igualdad de varian'as# de dos poblaciones biolgicas debe ser estudiada. Ha distribucin de la variable se supone que es normal e independiente en ambas poblaciones. 1espuKs de recoger in)ormacin mediante muestras de tamaGos n, + 11, nT + 10, respectivamente, se resume en S ,=
$ n # $ ( % i % ) =,,G i = # n , #
,
sT =
n # $ ( yi y ) =@,# i = # nT
T
Para Y + 0,1, contrastar= "a# W0= Q, + QT y W1= Q, [ QT "b# W0= Q, + QT y W1= Q, > QT "c# W0= Q, + QT y W1= Q, \ QT
$ W #< $ , < T
Estad"stico adecuado y regin cr"tica< ^ay dos poblaciones normales con medias desconocidas. Para
E ercicios y problemas resueltos de !nferencia Estad"stica 4 %=
determinar la regin cr"tica, ba o W=, se necesitan su forma y sus valores cr"ticos. El estad"stico de aba o se selecciona de la tabla de estad"sticos &p.e . en 2$3'< S$ , $ , S$ T $ T Se encuentra el valor cr"tico ]a aplicando la definicin de error de tipo !< '= P ( (rror tipo & )= P ( ;ec6a'ar W = * W = cierta )= P (B ( X , Y )< a )= P ( U ### , #=#< a )= P ( U #= , F< a ) # E =.#= P ( U #= , F< a )= P ( U F , #=% ) E a # = $,%+ E a ==,)% E ;c = {B < =,)% }. a S$ , S$ T
B ( X , Y )=
Un
# , nT #
B partir de la definicin de la distribucin A de Snedecor, es fcil ver -ue si , sigue una Un#,n$ entonces #S, sigue una Un$,n#. ?tilizamos este truco para consultar la tabla -ue tenemos.
1egla de decisin< Para tomar la decisin final sobre las hiptesis, hay disponibles dos metodolog"as. Para aplicar la primera, se eval>a el estad"stico B en las muestras espec"ficas x y y< B ( x , y )= S, S, ,,G = = ==,G, E B ( x )3 ;c E 6o se rec,a*a W= $ n #= ST T $ @,# s nT # T #= #
$ $
&Para calcular la cuasivarianza ST2, la propiedad general ( n 1 ) S 2 =n s 2 ha sido utilizada.' 5a segunda metodolog"a re-uiere el clculo del nivel cr"tico o p(valor< pD = P ( X tan rec6a'adora como x * W = cierta )= P ( B ( X , Y )B ( x , y ))= P ( U #= , F=,G, )==,)# E pD ==,)# > =,#=' E 6o se rec,a*a W=
Con el cdigo pf(0.86, 10, 9)en el lengu !e de p"og" # cin ;.
$ W #< $ , > T
B ( X , Y )=
S, S$ T
Un
# , nT #
'= P ( (rror tipo & )= P ( ;ec6a'ar W = * W = cierta )= P (B ( X , Y )> a )= P ( U ### , #=#> a )= P ( U #= , F> a ) E a = $,)$ E ;c = {B > $,)$ }. 1egla de decisin< Se eval>a el estad"stico B en las muestras espec"fica x y y<
B ( x , y )==,G, E B ( x )3 ;c E 6o se rec,a*a W=
5a segunda metodolog"a re-uiere el clculo del nivel cr"tico o p(valor< pD = P ( X tan rec6a'adora como x * W = cierta )= P ( B ( X , Y )%B ( x , y ))= P ( U #= , F%=,G, )=# =,)#==,+F
$ W #< $ , 1T
B ( X , Y )=
Un
# , nT #
donde se ha utilizado la funcin de cuantiles del lengua e de programacin 1< > qf(c(0.05 , 0.95), 10, 9) [1] 0.3310838 3.1372801 1egla de decisin< El estad"stico B es evaluado en las muestras concretas x y y< B ( x , y )==,G, E B ( x )3 ;c E 6o se rec,a*a W= Para aplicar la metodolog"a basada en el nivel cr"tico, calculamos qf(0.5, 10, 9)=1.007739, -ue es la medianaO como B&x,y' est en la cola iz-uierda< pD = P ( X tan rec6a'adora como x * W = true )= $ P ( B ( X , Y )B ( x , y ))=$=,)#==,G$ E pD ==,G$ > =,#=' E 6o se rec,a*a W=
Cota< Por definicin, el nivel cr"tico o p(valor toma un valor entre = y # &es una probabilidad'. Si no sabemos en -u cola est B&x,y' y consideramos la incorrecta, nos daremos cuenta por-ue el doble de la probabilidad de la cola ser"a mayor a #.
1ontrastes no param%tricos
Ejercicio 1c,-np
Bres productos )inancieros 6an sido comerciali'ados y la presencia de inters 6a sido registrada para algunas personas. (s posible imaginar di)erentes situaciones en las que los siguientes datos podr$an ser obtenidos.
Producto 1 Producto 2 Producto 3 Grupo 1 Grupo 2
10 20 /0
18 1/ /1
V 1! 24
/@ 48 8!
"a# Si 48 personas del grupo 2 )ueron situados considerando la variable producto, contrasta si esta variable sigue la distribucin determinada por la muestra del grupo 1 cuando Y + 0.01. "b# Si se entrevista a /@ personas del primer grupo y 48 personas del segundo, contrasta la 6omogeneidad de la distribucin de la variable producto en ambos grupos cuando Y + 0,01. "c# Ha gente con interKs en alguno de los productos )ue clasi)icada despuKs de considerar las dos variables grupo y producto. 5ontrasta la independencia de las dos variables cuando Y + 0,01.
(a) ^iptesis y nivel de significancia< El nivel [ M =,=# est dado. Para un contraste no paramtrico de bondad
de a uste, la hiptesis nula supone -ue las probabilidades tericas del segundo grupo siguen las probabilidades de la muestra del primer grupo, la referencia. Si Pi representa la variable producto en la poblacin i(sima, W =< P$P# y W # < P $ U 1 P#
&i )$ d ( 2 i e $ Z s # e &i
1egla de decisin< 5a variable P# sigue la distribucin con valores d#, $, %e y probabilidades d#=S%@, #GS%@, FS%@e.
) (
) (
F #+ )G %@ + F )G %@
) =F,%) E B ( x)# ;
E 5e rec,a*a W=
F,%) no est en las tablas -ue tenemos, mintras -ue F,$# s" est
(b) ^iptesis y nivel de significancia< El nivel [ M =,=# est dado. Para un contraste no paramtrico de
homogeneidad, la hiptesis nula supone -ue las probabilidades de cual-uier columna son las mismas para los dos grupos, esto es, son independientes del grupo o estrato. Si ] representa la variable grupo,
W = < U ( %* ] )= U ( % )
W # < U ( %* ] )1 U ( % )
Estad"stico y regin cr"tica< B partir de la tabla de estad"sticos &p.e . en 2$3', ( 2 i< e&i< ) d B ( X )=i=# <=# ($H#)( Z #) e&i<
H Z $
con H+ $ grupos y Z M % clases 6os de las tres probabilidades deben ser estimadas, as" s M $
Para calcular el cuantil a, se aplica la definicin de error de tipo !< '= P ( (rror tipo & )= P ( ;ec6a'ar W = * W = cierta )= P ( B ( X )# ;c * B , $ ), P ($ > a )= # P ( $ a ) E
$ P ( $ a ),# '=#=,=# ==,FF E a , F,$# $ $ $
1egla de decisin< Se supone una distribucin subyacente, aun-ue no espec"fica, por lo -ue las probabilidades son estimadas directamente a partir de la informacin muestral.
B ( x )=
#= %@
%= G+ %= %@ G+
) + !+ (
#+)G
$) G+ =),$F E B ( x )3 ;c E 6o se rec,a*a W= $) )G G+
$ = # P ( $ $< ),$F )> # P ( #< ),,#)=#=,F = =,# E pD > =,# > =,=#=' E 6o se rec,a*a W=
),$F no est en la tabla -ue tenemos, mientras -ue ),,# s" est
(c) ^iptesis y nivel de significancia< El nivel [ M =,=# est dado. Para un contraste no paramtrico de
independencia, la hiptesis nula supone -ue las probabilidades de cada celda es el producto de las probabilidades de su fila y columna, W = < ) ( % , y )= ) ( % ) ) ( y ) y W # < ) ( % , y )1 ) ( % ) ) ( y )
B ( X )=i=# <=#
con
1egla de decisin< Se supone una distribucin subyacente, aun-ue no espec"fica, por lo -ue las probabilidades son estimadas directamente a partir de la informacin muestral.
Si aplicamos la metodolog"a basada en el nivel cr"tico o p(valor, pD = P ( X tan rec6a'adora como x * W = cierta )= P ( B ( X )%B ( x ) * B , $ ), P ( $ %),$F )
$ $ = # P ( $< ),$F )> # P ( #< ),,#)=#=,F ==,# E pD > =,# > =,=#=' E 6o se rec,a*a W=
Cota< El contraste de homogeneidad puede ser visto como un caso particular del contraste de independencia donde una variable, digamos ], indica la pertenencia al grupo o estrato y, al mismo tiempo, el n>mero de elementos en cada muestra ha sido fi ado, lo -ue puede verse como restricciones donde se condiciona la distribucin con unta a ciertos valores para ]O esto implica -ue las probabilidades Vse estiman automticamenteW. Ctese -ue los resultados numricos y la decisin son los mismos en ambos tipos de contraste. Por otro lado, el contraste de bondad de a uste puede ser visto como un caso particular del contraste de homogeneidad con dos muestras donde una de ellas determina el modelo de referencia para la hiptesis nula &un vector de frecuencias determina un vector de probabilidades'. Cota< En este e ercicio, la independencia y homogeneidad no han sido rechazadas, mientras -ue la hiptesis -ue supone -ue la variable producto sigue en la poblacin $ la distribucin determinada por la muestra del grupo #. Por otro lado, la distribucin determinada por una muestra, involucrada en &a', es en general diferente de la distribucin subyacente com>n supuesta, involucrada en &b' y &c', -ue es estimada usando las muestras de ambos grupos. Entonces, esta distribucin subyacente Vest entre las dos muestrasW, lo -ue puede ustificar las decisiones en &a', &b' y &c'O de hecho, en este caso concreto el grupo $ tiene mayor peso al determinar esa distribucin por tener ms elementos.
&i< puede aplicarse la misma regla mnemotcnica tanto en el contraste de homogeneidad como en el Cota< En la prctica, para las estimaciones e de independencia< para cada posicin, multiplicar por las frecuencias absolutas de la fila y la columna y dividir por el n>mero total de elementos n.
7eferencias
819 /asado, 6. Werramientas bsicas de Eatemticas, http<SS777.casado(d.orgSeduS^erramientas:asicas6eMatematicas.pdf 829 /asado, 6. &n)erencia estad$stica,
http<SS777.casado(d.orgSeduSdocencia.htmlfMatematicas!ntermedias(Estadistica(!nferenciaEstadistica