Está en la página 1de 18

CAPÍTULO 13

ESTIMACIÓN SIMULTÁNEA DE TENDENCIAS EN


LA MEDIA Y LA VARIANZA
Witoki G. Strupczewski

GRUPO 7
Alumnos:
• AGUILAR MEDINA, Josue Jhosep
• AROTOMA VELIZ, Aldaid Gerardo
• DESPOSORIO DE LA CRUZ, Fernando
• YAHUAR CUSI, Kuntur Kanki
• GUTIERREZ SONCCO, Luis Angel
1. CONCEPTOS PREVIOS
USADOS A LO LARGO DEL TEXTO
• A) PARÁMETRO ESTADÍSTICO:
• En estadística se conoce como parámetro a un numero que permite resumir
las características que se pueden derivar del estudio de una variable
estadística.
• De esta manera se tienen los parámetros: Media, Moda, Desviación
Estándar, Varianza, etc.
• Estos parámetros se pueden desarrollar mediante formulas aritméticas o
algebraicas, razón por la cual se encuentran bien definidas.
• A.1) Momentos: Una manera de generalizar toda la teoría anterior.
Tenemos los momentos centrados y momentos no centrados.
A.1) Momentos:
• Momentos centrados: De una distribución de datos, definimos el momento
central o momento centrado de orden K como:
σ(𝑥𝑖 −𝑥)𝑘
• 𝜇𝑘 = ; De esta definición tenemos que:
𝑛
• 𝜇1 = 0; 𝜇2 = 𝜎 2
• Momentos no centrados: Definida de manera análoga a la anterior
expresión:
σ(𝑥𝑖 )𝑘
• 𝑚𝑘 = ; De esta definición se tiene:
𝑛
• 𝑚1 = 𝑥; 𝑚2 − 𝑚1 2 = 𝜎 2
• De esta definición, tenemos que tener en cuenta que:
• Primer momento estadístico: Media
• Segundo momento estadístico: Desviación Estándar
B) FUNCION DE AUTOCORRELACIÓN
• Llamada también dependencia secuencial, es una herramienta que se usa
generalmente en el procesamiento de señales.
• Esta se define como la correlación cruzada (COVARIANZA X, Y) de la señal
consigo misma, es decir, que mide la correlación de la señal dada, con la
misma señal pero desplazada una distancia t (puede ser el periodo o k
periodos).
• La función de auto correlación es usada para encontrar patrones
repetitivos dentro de una señal (Identificar periodos), identificar la
frecuencia fundamental de una señal, entre otras aplicaciones.
C) HETEROCEDASTICIDAD:
Se dice cuando la varianza de los datos no es constante a
lo largo de las observaciones, esto se puede dar debido a
que los datos provienen de distribuciones muestrales
distintas, donde su varianza cambia. Heterocedasticidad y homocedasticidad.
D) PRINCIPIO DE PARSIMONIA
• El principio de parsimonia establece que la solución mas simple suele ser la
mejor.
• En el capitulo analizado, el autor nos menciona este principio y nos da a
entender que en estos temas tan tediosos, la solución sencilla nos puede dar
los mejores resultados.
E) EL MÉTODO DE MAXIMA VEROSIMILITUD
• Conocido también como ML por el autor del texto analizado, es un método
para ajustar un modelo y estimar sus parámetros.
• Con este método se busca encontrar los valores mas probables de los
parámetros de distribución para un conjunto de datos, esto se consigue,
maximizando la Función de Verosimilitud. 𝑓(𝑥; 𝜃1 , 𝜃2 , … , 𝜃𝑘 ) que se basa en
una función de densidad de la probabilidad para la distribución dada.
2. INTRODUCCIÓN
• En primera instancia el titulo nos da a conocer que el libro se centrara en el
estudio de un método para estimar la tendencia en la media y la varianza.
• La tendencia en datos a largo plazo o datos anuales es generalmente en el
valor medio, como se dijo en clase. Sin embargo, dicha tendencia no es la
única; también esta lo que es el cambio en el valor (Tendencia) de la
varianza, y este cambio resulta importante en el desarrollo de la sociedad.
• Por ejemplo, la tendencia creciente en la varianza de la temperatura del aire
invernal significa que los inviernos mas severos son mas probables a ocurrir.
La tendencia surge como un incremento en el valor del parámetro a
medida que se desarrollan los datos (puede ser función temporal,
etc.). El incremento en la varianza se puede traducir en un
incremento de valores extremos en los datos; razon por la cual se
pueden presenciar hechos mas severos.
2. INTRODUCCIÓN
• Un cambio en la función de auto correlación afecta la probabilidad de
una secuencia de inviernos ya sean templados o severos; esto porque el
cambio en la función de auto correlación significa un cambio en como
los datos se presentan periódicamente.
• El autor esclarece que el alcance del trabajo de investigación solo se
restringe a un método paramétrico para la estimación simultanea de la
tendencia en la media y la varianza; teniendo en cuenta la
heterocedasticidad.
• El autor recomienda que al analizar series largas de caracteres
desconocidos, se parta del caso mas general; donde los primeros
momentos no tengan una relación funcional y luego pasar a casos mas
simples; y apartir de esta, identificar el caso que mejor se ajusta.
2. INTRODUCCIÓN
• La investigación propuesta puede incluir diversas formas funcionales
como lineales, parabólicas, etc.
• El nivel de significación no se incluyo en el análisis.
• El modelo que refleja el mejor ajuste entre los demás, se toma como
el óptimo.
2. Discusión de los métodos
3. Método de mínimos cuadrados
ponderados
• El método de mínimos cuadrados ponderados (WLS por sus siglas en ingles), se basa
en la minimización de las sumas de las desviaciones cuadradas ponderadas de los
momentos observados y estimados. Los pesos son recíprocos de sus valores
esperados (Strupczewski & Kaczmarek, 1998).
• El WLS coincide con el ML (máxima verosimilitud) cuando los datos son distribuidos
normalmente, en este caso el WLS se presentaría como un problema de estimación de
ML. Se realiza una presentación simple del WLS, considerando la estimación del ML:
• La función logaritmo-verosimilitud en una serie temporal sujeta a distribución normal
con parámetros variables de tiempo tiene una forma:
(𝑥𝑡 −𝑚𝑡 )
• 𝑙𝑜𝑔𝐿 → − σ𝑇𝑡=1 𝑙𝑛𝜎𝑡 − σ𝑇𝑡=1 (13.1)
2𝜎𝑡2
• Donde 𝑚𝑡 = 𝑚(𝐠, 𝑡) y 𝜎𝑡 = 𝜎(𝐡, 𝑡) son media y desviación estándar dependientes
del tiempo, respectivamente, mientras que g y h son vectores de parámetros.
3. Método de mínimos cuadrados
ponderados
• De acuerdo a lo ultimo, la media y la desviación estarán sujetos a
dependencia de parámetros y primordialmente del tiempo.
• Las condiciones para el máximo logL, se obtienen de la teoría de
máximos y mínimos:
𝑑 𝑙𝑜𝑔𝐿 𝑇 (𝑥𝑡 −𝑚𝑡 ) 𝑑𝑚𝑡
• → σ𝑡=1 =0 (13.2)
𝑑𝑔 𝜎2
𝑡 𝑑𝑔
𝑑 𝑙𝑜𝑔𝐿 𝑇 1 𝑑𝜎𝑡 𝑇 𝑥𝑡 −𝑚𝑡 2 𝑑𝜎𝑡
• → − σ𝑡=1 + σ𝑡=1 =
𝑑ℎ 𝜎𝑡 𝑑ℎ 𝜎𝑡3 𝑑ℎ
𝑇 1 2 2 𝑑𝜎𝑡
•= σ𝑡=1 3 𝑥𝑡 − 𝑚𝑡 − 𝜎𝑡 =0 (13.3)
𝜎𝑡 𝑑ℎ
3. Método de mínimos cuadrados
ponderados
• Se debe tner en cuenta que estos conjuntos de ecuaciones, contienen
tanto a la media como a la desviación estándar, que se deben resolver
conjuntamente; de ahí el nombre del método de estimar simultáneamente
la tendencia en la media y la desviación estándar.
• El método WLS cubre cuatro clases de tendencia, es decir:
• A – Tendencia solo en la media, que es el problema común de mínimos
cuadrados en la estimación de tendencia.
• B – Tendencia solo en la desviación estándar.
• C – Tendencia tanto en la media como en la desviación estándar que están
funcionalmente relacionadas, por ejemplo, por un valor constante del
coeficiente de variación (Cv).
• D – Tendencia no relacionada en la media y la desviación estándar.
3. Método de mínimos cuadrados
ponderados
• El caso más básico es el de los momentos invariables en el tiempo, se
conoce como la opción estacionaria (S). En este caso, las ecuaciones
(13.2) -(13.3) se reducen a las ecuaciones de MOM.
• La prueba de bondad de ajuste basada en el criterio de información
de Akaike sirve para identificar un modelo óptimo en una clase de
modelos competitivos de tendencia:
• 𝐴𝐼𝐶 = −2ln𝑀𝐿 + 2𝑘 (13.4)
• Donde ML denota la máxima verosimilitud para el modelo y k es el
número de parámetros ajustados. El mejor modelo de aproximación
es el que alcanza el valor mínimo de AIC en todos los medelos
evaluados.
3. Método de mínimos cuadrados
ponderados
• Las ecuaciones (13 .2) - (13.3) derivadas aquí para la estimación de ML de los
parámetros variables de tiempo de las variables con distribución normal, como
ya se vio, son equivalentes a las ecuaciones WLS. Estas ecuaciones pueden ser
validas para otras distribuciones si se cumplen ciertas condiciones.
• El autor nos muestra la Tabla 13.1 que indica la aplicabilidad de las ecuaciones
(13.2) - (13.3) para varias funciones de distribución de dos y tres parámetros y
varias clases de tendencia.
• Se acepta un valor constante del coeficiente de variación para la clase C.
• Se examinaron seis FDP, a saber: Normal (N), Logormal (LN2) de dos parámetros,
Lognormal (LN3) de tres parámetros, Gamma (P2), tres- parámetro Pearson (P3)
y GEV del primer tipo, es decir Fisher-Tippett del primer tipo (FT).
3. Método de mínimos cuadrados
ponderados
• El sombreado indica la aplicabilidad del método WLS para el caso,
mientras que el color oscuro denota los casos de pesos iguales, es
decir, donde son aplicables tanto el método LS como el MOM.
• La ausencia de sombreado indica casos en los que la ecuación (13.3)
no se cumple.
Modelo Distribución Las limitaciones del método WLS no restringen, de
Tendencia N LN2 LN3 P2 P3 FT
manera significativa, su aplicación climatológica o
S
A
hidrológica. Esto se debe a que la falta de
B 𝑐𝑠 = 𝑐𝑡𝑒. 𝑐𝑠 = 𝑐𝑡𝑒. información previa sobre la forma funcional de la
C 𝑐𝑠 = 𝑐𝑡𝑒. 𝑐𝑠 = 𝑐𝑡𝑒. distribución de probabilidad otorga cierta libertad de
D 𝑐𝑠 = 𝑐𝑡𝑒. 𝑐𝑠 = 𝑐𝑡𝑒. elección de distribución.
Tabla 13.1. Aplicabilidad de la estimación ponderada de
mínimos cuadrados (WLS, en inglés) de tendencia para
varios tipos de distribución de probabilidad y varias clases
de tendencia. 𝑐 es el coeficiente de asimetría.
3. Método de mínimos cuadrados
ponderados
• Para el caso de la elección de la distribución y la aplicabilidad del
método WLS en todos los casos, se puede reemplazar la variable
temporal por un parámetro, resultando asi el método WLS aplicable.
• Por ejemplo, en lugar de la distribución Lognormal (LN2) o Gamma
(P2) de dos parámetros, se pueden suponer distribuciones de tres
parámetros con coeficiente de asimetría invariante en el tiempo (por
ejemplo, LN3 o P3). Con este enfoque, el método WLS es
efectivamente aplicable en todos los casos anteriores.
Modelo Distribución
Tendencia N LN2 LN3 P2 P3 FT
S
A
B 𝑐𝑠 = 𝑐𝑡𝑒. 𝑐𝑠 = 𝑐𝑡𝑒.
C 𝑐𝑠 = 𝑐𝑡𝑒. 𝑐𝑠 = 𝑐𝑡𝑒.
D 𝑐𝑠 = 𝑐𝑡𝑒. 𝑐𝑠 = 𝑐𝑡𝑒.
3. Método de mínimos cuadrados
ponderados
• Se puede realizar una evaluación aproximada del tipo de función de
distribución de probabilidad, usando una serie temporal observada.
• Sin embargo lo anterior debería ser seguido de un análisis mas
detallado realizado en la serie reducida a condiciones estacionarias.
• Por ejemplo, suponiendo una distribución normal para las series
(Y1,Y2,…Yt,..) donde Yt = (Xt — mt)/σt es la variable estandarizada.
• Por ejemplo, considere el caso de una clase D con tendencia de forma
lineal mt=a+bt y σt=c+dt.
3. Método de mínimos cuadrados
ponderados
• Luego, las ecuaciones (13.2) y (13.3) toman la siguiente forma:
𝑇 1
• 𝑡=1
σ 2 𝑋𝑡 − 𝑎 + 𝑏𝑡 =0 (13.2a)
𝑐+𝑑𝑡

𝑇 𝑡
• σ𝑡=1 𝑋𝑡 − 𝑎 + 𝑏𝑡 =0 (13.2b)
𝑐+𝑑𝑡 2

𝑋𝑡 − 𝑎+𝑏𝑡 1
• σ𝑇𝑡=1 3 − σ 𝑇
𝑡=1 =0 (13.3a)
𝑐+𝑑𝑡 𝑐+𝑑𝑡
𝑡 𝑋𝑡 − 𝑎+𝑏𝑡 2 𝑡
𝑇 𝑇
• σ𝑡=1 − σ𝑡=1 =0 (13.3b)
𝑐+𝑑𝑡 3 𝑐+𝑑𝑡
• Mientras el Criterio de información de Akaike (AIC en inglés) da la expresión:
𝐴𝐼𝐶 = − ln 𝑀𝐿 + 8
• Para solucionar (13.2a-b) y (13.3a-b), Se aplicó un método de gradiente con
estimaciones de momento del caso estacionario como el vector inicial

También podría gustarte