Documentos de Académico
Documentos de Profesional
Documentos de Cultura
[3] Mood, A. M., Graybill, A. F. y Boes, D. (1974). Introduction to the Theory of Statistics. Mc Graw
Hill.
[4] Hogg, R. V. y Craig, A. T. (1978). Introduction to Mathematical Statistics. Collier Mac Millan
Internacional Editions.
[5] Bhataccharyya y Johnson (2006). Statistics: Principles and Methods. John Wiley & Sons.
[6] Pawitan, Y. (2001). In All Likelihood. Statistical Modeling and Inference Using Likelihood.
Oxford: Oxford Science Publications.
[7] Sagan, Carl (1995). El mundo y sus demonios. La ciencia como una luz en la oscuridad. Mxico:
Editorial Planeta.
[9] Evans, M., Hastings, N. y Peacock, B. (1993). Statistical Distributions. John Wiley & Sons.
*12+ Box, G. E. P. (1980). Sampling and Bayes Inference in Scientific Modelling and Robustness.
JRSS, Series A, V.143, No. 4. pp. 383-430.
2.2 Otros mtodos de estimacin puntual. Estimadores de momentos. Estimador de mnima Ji-
cuadrada (Mood, Graybill y Boes).
2.6.2 Intervalos de confianza para un parmetro. Cantidades pivotales y su uso para construir
intervalos de confianza.
2.7. Criterios de optimalidad para seleccionar estimadores; ventajas y desventajas del error
cuadrtico medio como criterio. Propiedades deseables de estimadores: insesgamiento asinttico,
consistencia y eficiencia. Intervalos de estimacin vs. estimadores puntuales.
2) Planteo de un modelo
3) Estimacin del parmetro
4) Validacin del modelo
5) Comparacin con otros modelos
donde a cada elemento le asocia su probabilidad. Tradicionalmente, asociamos esta funcin con la
funcin de distribucin de una variable aleatoria:
Ejemplo:
Ejemplo:
Clasificacin de variables
Existen numerosas maneras de clasificar las variables aleatorias segn si distribucin. Estas
clasificaciones se conocen como familias de distribuciones. Dos de las ms grandes son las
siguientes:
Discretas Continuas
Poisson Normal
Geomtrica Exponencial
Bernoulli Gama
Hipergeomtrica Uniforme
Multinomial Ji-cuadrada
Binomial Negativa LogNormal
Uniforme t-Student
Weibull
Gumbell
Frchet
F-Fisher
Rayleigh
Maxwell
Beta
Logstica
LogF
Pareto
Cauchy
En cuya clasificacin caben todas las variables aleatorias conocidas.
que funciona adecuadamente tanto para distribuciones continuas como para discretas.
Familias de distribuciones
Las principales familias de distribuciones, adems de las continuas y discretas, son:
Se dice que una variable aleatoria pertenece a esta familia si su funcin de probabilidad o de
densidad se puede factorizar de la siguiente manera:
Dado que
Donde, definiendo
concluimos que la distribucin normal pertenece a la familia exponencial.
donde
que nos permite concluir que la distribucin Poisson tambin pertenece a la familia exponencial.
no se puede separar en funciones multiplicativas donde cada una dependa slo del argumento o
slo de los parmetros.
2) Localizacin y escala
Tiene exclusivamente dos parmetros, uno de localizacin y otro de escala. Los denotamos por
respectivamente.
y, para concluir que la distribucin normal pertenece a esta familia, queremos ver que esa funcin
de densidad no depende de los parmetros de localizacin o escala.
que claramente no depende de los parmetros de localizacin o escala y, por lo tanto, nos permite
concluir que la distribucin normal pertenece a la familia de localizacin y escala.
Recordemos que una variable aleatoria Z tiene distribucon Lognormal si su logaritmo distribuye
como una Normal con parmetros . Es decir, si , entonces ,
o bien, .
3) Valores extremos
Una aplicacin importante del teorema de convergencia aparece en el estudio de las posibles
distribuciones lmite para mximos normalizados de variables aleatorias independientes,
idnticamente distribuidas. Supongamos que es una sucesin independiente,
idnticamente distribuida con funcin de distribucin comn y sea
(a) Tipo I: , .
Este teorema fue originalmente propuesto por Fisher y Tippet en 1928 y demostrado
rigurosamente por Gnedenko en 1943. La distribucin (a) es la distribucin de Gumbel, (b) es la
distribucin de Frchet y (c) es la distribucin de Weibull.
Si se quieren transformar los datos para conseguir normalidad, el mejor mtodo para estimar el
parmetro es el de mxima verosimilitud.
6) Asimtricas
Demostracin
Ida:
Regreso:
Ejemplo:
a) (exponencial)
Recordando que
definimos
b) (gumbel)
o bien,
para que
Ejemplo:
Gumbel de mximos, .
entonces
Modos de convergencia
Convergencia casi segura
si existe un evento de medida cero tal que para cada se tiene que
Convergencia en probabilidad
o, equivalentemente,
Convergencia en distribucin
o, equivalentemente,
si se tiene que
Demostracin: P.D.
aplicado para :
pues
entonces
Teorema de Glivenko-Cantelli
El Teorema de Glivenko-Cantelli es consecuencia de la Ley fuerte de los grandes nmeros.
Demostracin: Por la ley fuerte de los grandes nmeros, es obvio que para cada tenemos la
convergencia casi segura:
Funcin Indicadora
Definimos la funcin indicadora de un conjunto como
En la mayora de los casos, las densidades o funciones de probabilidad de una distribucin pueden
expresarse en trminos de funciones indicadoras o, al menos, pueden incluirlas como un factor,
para asegurar que los parmetros cumplen las condiciones fijadas de inicio.
Invarianza
Hay dos aspectos de invarianza necesarios: mediciones y parmetros.
Cantidad Pivotal
Sea una variable aleatoria cuya distribucin depende de un parmetro desconocido y sea
una muestra aleatoria de
Una vez determinados los valores de , la expresin del intervalo se obtiene despejando de
la ecuacin resultante.
Mtodo de momentos
Momentos Empricos:
No centrales:
para
Centrales:
Momentos Tericos:
No centrales:
para
Centrales:
1) Caso discreto:
donde
2) Caso continuo:
donde es una funcin constante con respecto al parmetro. Normalmente escogemos esta
funcin de modo que nos quede la verosimilitud en funcin nicamente del parmetro de inters
en la medida de lo posible.
Tanto para la funcin verosimilitud como para la log verosimilitud, la eleccin de la funcin
constante no afecta el punto de maximizacin. Existen casos en los que es posible maximizar
cualquiera de estas dos funciones analticamente sin problemas. Cuando no, consideramos la
funcin marcador (score) definida como:
Teorema de Sluisky
Sea una muestra de variables aleatorias independientes, idnticamente distribuidas y
una funcin continua. Si
entonces
Consistencia
1) es consistente fuerte si
que es la distribucin de .
Anlogamente,
Recordando, si entonces
Se dice que una variable aleatoria pertenece a esta familia si su funcin de probabilidad o de
densidad se puede factorizar de la siguiente manera:
2) Localizacin y escala
Tiene exclusivamente dos parmetros, uno de localizacin y otro de escala. Los denotamos por
respectivamente.
3) Valores extremos
Una aplicacin importante del teorema de convergencia aparece en el estudio de las posibles
distribuciones lmite para mximos normalizados de variables aleatorias independientes,
idnticamente distribuidas. Supongamos que es una sucesin independiente,
idnticamente distribuida con funcin de distribucin comn y sea
(a) Tipo I: , .
Este teorema fue originalmente propuesto por Fisher y Tippet en 1928 y demostrado
rigurosamente por Gnedenko en 1943. La distribucin (a) es la distribucin de Gumbel, (b) es la
distribucin de Frchet y (c) es la distribucin de Weibull.
donde y .
Si se quieren transformar los datos para conseguir normalidad, el mejor mtodo para estimar el
parmetro es el de mxima verosimilitud.
6) Asimtricas
que funciona adecuadamente tanto para distribuciones continuas como para discretas.
7. La grfica cuantil-cuantil, QQ, para comparar los cuantiles empricos con los tericos.
Ley fuerte de los grandes nmeros. Sea una sucesin de variables aleatorias
independientes idnticamente distribuidas con media y considrese la sucesin de los
promedios aritmticos , entonces se cumple
Ley dbil de los grandes nmeros. Sea una sucesin de variables aleatorias
independientes idnticamente distribuidas con media y considrese la sucesin de los
promedios aritmticos , entonces se cumple
Demostracin: Por la ley fuerte de los grandes nmeros, es obvio que para cada tenemos la
convergencia casi segura:
donde es una funcin constante con respecto al parmetro. Normalmente escogemos esta
funcin de modo que nos quede la verosimilitud en funcin nicamente del parmetro de inters
en la medida de lo posible.
Tanto para la funcin verosimilitud como para la log verosimilitud, la eleccin de la funcin
constante no afecta el punto de maximizacin. Existen casos en los que es posible maximizar
cualquiera de estas dos funciones analticamente sin problemas. Cuando no, consideramos la
funcin marcador (score) definida como:
menos la segunda derivada con respecto al parmetro. Habremos encontrado un mximo cuando
TAREA
1. Demuestra que la variable Bernoulli pertenece a la familia exponencial de un
parmetro.
Ofrecemos la factorizacin:
como es continua
de donde
de donde
Finalmente, consideramos
Puesto que por ser una probabilidad, el valor mximo se encuentra cuando
, es decir, cuando de donde como era de esperarse.
de donde
6. Grafica a mano la funcin de distribucin emprica para una muestra con las
siguientes cuatro observaciones ordenadas: