Está en la página 1de 12

2.5.

6 Proceso de máxima verosimilitud de regresión múltiple

El método de máxima verosimilitud permite escoger entre un grupo de


valores el que más tiene probabilidad de ocurrir según los datos que se han
observado, considerando que el modelo matemático que es usado es adecuado y
correcto.

Para poder hacer el cálculo se toma en cuenta la función máxima


verosimilitud, considerando de que existen parámetros como p=k+1 y k, la cual es
una variable explicativa. Quedando la siguiente expresión:

Donde, luego de realizar diversos procesos matemáticos, se llega a la


ecuación de estimación del vector de parámetros, la cual es:

2.5.7 Análisis de Varianza

“Es una fórmula estadística que se utiliza para comparar las varianzas entre
las medias (o el promedio) de diferentes grupos. Una variedad de contextos lo
utilizan para determinar si existe alguna diferencia entre las medias de los
diferentes grupos.” (TIBCO, s.f.)

Por lo tanto, es necesario y aplicar la varianza en diversos estudios y


métodos para poder determinar si algunos tratamientos están dando los resultados
esperados o si aplicando diversos métodos existe desviación en los resultados
obtenidos.

Es necesario seguir ciertos pasos al momento de realizar un análisis de la


varianza, entre ellos se encuentra:
- Determinar si las diferencias entre las medias de los grupos son
estadísticamente significativas.
- Examinar las medias de los grupos.
- Comparar las medias de los grupos.
- Determinar hasta qué punto el modelo se ajuste a sus datos.
- Determinar si el modelo cumple con los supuestos del análisis.

Cabe destacar que existe fórmulas que permiten cuantificar la varianza y


que pueden estar relacionadas con el modelo de regresión, para indicar como se
relaciona con la variabilidad total, con respecto al error. Por otra parte, se usa
mucho la varianza para conocer como aporta una variable.

Con este método se puede calcular dos tipos de sumas, las cuales son
conocidas como simas tipo I y suma tipo III.

2.5.8 Anova con sumas de cuadrados tipo I

Este tipo de suma también es conocida por ser secuencial, la misma


permite conocer la variación y los aportes que hace cada una de las variables que
condicionan el orden de entrada.

“En esta se consignan las sumas de cuadrados extra: miden el aporte que
cada variable hace condicionada a las variables que ingresaron al modelo
previamente.” (Valencia, Ramírez, Tabares, & Velásquez, 2014)

Cabe destacar que siempre al final la mayoría de los Anova buscan es


finalizar con la suma de los cuadrados, ya que, expresa la variación total que se
puede atribuir a los diferentes factores.

2.5.8 Anova con sumas de cuadrados tipo III

Este modelo también es conocido como marginal u ortogonal, y se obtiene


cuando cada variable se añade la última en el modelo, por lo tanto, el efecto de
cada variable es el que se calcula después de que todos los factores ya se han
tenido en cuenta.

Cuando se aplica el modelo como se expuso, finalmente se logra que todos


los términos sean equivalentes al que se obtiene con el tipo I, siempre y cuando el
termino entra en el último modelo.

En el caso de dos factores con interacción, la suma de


cuadrados del efecto del factor AA es la diferencia entre las
sumas de cuadrados del error del modelo y ~ B + A:B y del
modelo completo y ~ A + B + A:B. (erre-que-erre-
paco.blogspot.com, 2016)

2.5.10 Proceso de selección

Al momento que se toma la decisión de hacer una elección de las variables


se debe pasar un proceso, el cual es conocido como proceso de selección, con el
fin de que se pueda escoger las mejores variables independientes que permitan
explicar significativamente la variabilidad de la respuesta Y.

Entre los procesos que se pueden llevar a cabo para la selección se


encuentra:

 Selección desde atrás o Backward.

- Se introducen todas las variables en la ecuación y después se van

excluyendo una tras otra.

- En cada etapa se elimina la variable menos influyente según el contraste

individual (de la t o de la F).

 Selección hacia adelante o Forward.


- Las variables se introducen secuencialmente en el modelo.

- La primera variable que se introduce es la de mayor correlación (+ o -)

con la variable dependiente.

- Dicha variable se introducirá en la ecuación solo si cumple el criterio de

entrada.

- A continuación, se considera la variable independiente cuya correlación

parcial sea la mayor y que no esté en la ecuación.

- El procedimiento termina cuando ya no quedan variables que cumplan el

criterio de entrada.

 Selección Adelante/atrás o Stepwise.

- Este método es una combinación de los procedimientos anteriores.

- En cada paso se introduce la variable independiente que no se

encuentre ya en la ecuación y que tenga la probabilidad para F más

pequeña (i.e. hacia adelante).

- Las variables ya introducidas en la ecuación de regresión pueden ser

eliminadas del modelo (i.e. hacia atrás).

- El método termina cuando ya no hay más variables candidatas a ser

incluidas o eliminadas.

2.5.11 Intervalos de confianza

Un intervalo de confianza es una técnica de estimación utilizada


en inferencia estadística que permite acotar un par o varios pares de valores,
dentro de los cuales se encontrará la estimación puntual buscada (con una
determinada probabilidad).
Es decir, que permite aproximar, una vez se calcule el valor de la variable
en la muestra, entre que rango de valores se encuentra el valor real inaccesible de
la variable en la población.

El valor real puede encontrarse (1-α )100% de las veces.

2.5.12 Intervalos para el modelo de regresión lineal simple

La regresión lineal simple consiste en generar un modelo de


regresión (ecuación de una recta) que permita explicar la relación lineal que existe
entre dos variables. A la variable dependiente o respuesta se le identifica como Y
y a la variable predictora o independiente como X.

Para una respuesta media el intervalo estará dado por:

Para una respuesta predicha el intervalo estará dado por:

2.5.13 Intervalos para el modelo de regresión lineal múltiple

Es un modelo estadístico versátil para evaluar las relaciones entre un


destino continuo y los predictores. Los predictores pueden ser campos continuos,
categóricos o derivados, de modo que las relaciones no lineales también estén
soportadas.

Para aplicar la regresión lineal múltiple que nos estamos proponiendo, los


datos deben cumplir con los 5 supuestos ya mencionados: linealidad,
independencia, homocedasticidad, normalidad y no colinealidad.
Para una respuesta media el intervalo estará dado por:

Para una respuesta predicha el intervalo estará dado por:

2.5.14 Validación de supuestos del modelo

Para poder validar el modelo de regresión se puede hacer uso de:

 Distribución normal para los residuales.


 Varianza constante.
 Incorrelación para los residuales, cuando los datos son cronológicos.

Métodos para validar supuestos del modelo.

 Gráficos.
 Residuales vs valores ajustados: Debe haber uniformidad alrededor del
residual 0, sin patrones de conos o trayectorias que indiquen
heterocedasticidad (no homogeneidad de la varianza).
 Cuantiles cuantiles normales (QQ-norm): Se estiman los residuales
teóricos bajo la distribución normal, y se grafican contra los reales
estandarizados. Los puntos graficados deben caer en una línea casi
recta, además, deben caer en un intervalo entre las bandas de -2 a 2, de
esta manera no existirían puntos aislados que alteren la normalidad
fuera de estas bandas

Entre las pruebas que se pueden hacer se encuentran:

 Prueba de normalidad de Shapiro Wilks.


 Prueba de homogeneidad de varianza de Barlett.
 Prueba de incorrelación de Durbin Watson.
 Prueba de incorrelación de Prueba de Box Pierc.

2.5.15 Criterios de ajuste

Un modelo se ajusta bien a los datos si las diferencias entre los valores
observados y los valores de predicción del modelo son pequeñas y no presentan
sesgo. Antes de examinar las medidas estadísticas de bondad
de ajuste, se recomienda revisar las gráficas de residuos.

Es muy necesario hacer los ajustes normalmente para poder obtener en el


resultado final el nivel óptimo que se desea.

2.6 Definición modelo econométrico

Un modelo econométrico es un modelo estadístico o matemático que


representa la relación entre dos o más variables. Su utilización permite hacer
estimaciones acerca del efecto de una variable sobre otra y/o hacer predicciones
acerca del valor futuro de las variables.

Tiene la siguiente estructura: una variable endógena y una o más variables


exógenas o explicativas y, un error.

 Variable endógena: Una variable o factor que es causada o explicada


por otro conjunto de variables independientes (que son determinadas
por otros factores fuera del modelo).
 Variables exógenas: Variables que determinan o explican a la variable
endógena y que son independientes entre sí.
 Error: Captura el efecto de otros parámetros desconocidos.

Normalmente se encuentra relacionada con variables como:

 Tiempo
 Dia
 Tendencia senoidal
 Tres rezagos

Dependiendo de la información que se maneja, existen 3 tipos de modelos


econométricos, los cuales son:

 Datos de corte transversal: Datos de un individuo o agente que se


recogen en un momento en el tiempo, por ejemplo, un censo.
 Series de tiempo: Datos de una misma variable que se recogen a lo
largo del tiempo, por ejemplo, el PIB de un país durante 10 años.
 Paneles: Se recoge la información a lo largo del tiempo para cada
unidad de información. Así, por ejemplo, se recoge la información de
una familia a lo largo del tiempo. Son datos de corte transversal que se
siguen en el tiempo.

2.7 Método de Suavización exponencial simple

La suavización exponencial, es una técnica de análisis de pronóstico de


series de tiempo, que tiene como característica la predicción de los valores futuros
en función de la ponderación exponencial de los periodos anteriores, teniendo
mayor peso los periodos recientes que los antiguos (Gardner, 2006). Además, es
un modelo en el que se puede incorporar fácilmente el nivel, la tendencia y la
estacionalidad que presentan los históricos de la serie temporal (Hyndman et al,
2008).

Según Bowerman et al. (2007) la suavización exponencial es más eficaz


cuando la tendencia y la variación estacional de las series pueden manifestar
cambios en el tiempo.
2.8 Método de Suavización exponencial lineal: método Holt

Este modelo es apropiado para series en las que hay una tendencia lineal y
sin estacionalidad. Sus parámetros de suavizado son el nivel y la tendencia, que
no están limitados por los valores del otro. El modelo de Holt es más general que
el modelo de Brown, pero puede tardar más en computar para grandes series. El
suavizado exponencial de Holt es más parecido a un modelo ARIMA con cero
órdenes de autoregresión, dos órdenes de diferenciación, y dos órdenes de media
móvil.

Este involucra tendencias lineales locales que se van desarrollando dentro


de la serie de tiempo. Además, suaviza directamente el nivel y la pendiente,
usando diferentes constantes de suavizamiento para cada una, por lo tanto, tienen
la ventaja de adaptarse y ser flexibles a nuevas observaciones que se van
encontrando en la serie temporal

2.8.1 Ejemplo: Aplicación del método de suavización exponencial


lineal de holt al caso de la energía diaria

Normalmente estos modelos son realizados mediante software que se


encuentran especializados, uno de los programas más usados son Statgraphics, el
mismo permite encontrar las estimaciones y los coeficientes de suavización, los
cuales representa la media y la tendencia, un valor para cada uno.

En el ejemplo mostrados se obtuvo que

alpha = 0,3239 (media)

beta= 0,0036 (tendencia)

Se encontró una desviación muy similar de los ajustes versus los valores
pronosticados.
2.9 Modelos ARIMA y SARIMA

Se trata de un modelo autorregresivo integrado de promedio móvil. ARIMA


es el acrónimo del ingés autoregressive integrated moving average. Seguramente
no hayas entendido nada, así que vamos por partes.

También es conocido como un modelo mixto con componente


autorregresiva y otra de media móvil, también, es definido como una clase de
modelos estadísticos para analizar y pronosticar series de tiempo datos.

En primer lugar, el modelo autorregresivo se basa en la idea de que la


observación actual puede explicarse con valores pasados. Estos modelos se
denotan como AR(p) siendo p el número de muestras que explican la muestra
actual. Es decir, un AR(1) quiere decir que sólo la muestra anterior y el ruido
contribuye a la salida. Un AR(2) las dos anteriores y el ruido, etc. 

Los parámetros del modelo ARIMA se definen de la siguiente manera:

 pag: El número de observaciones de retraso incluidas en el modelo,


también llamado orden de retraso.
 D: El número de veces que se diferencian las observaciones sin
procesar, también llamado grado de diferenciación.
 q: El tamaño de la ventana de la media móvil, también llamado orden de
la media móvil.
Bibliografía

erre-que-erre-paco.blogspot.com. (30 de Diciembre de 2016). Diferentes sumas de


cuadrados en ANOVA. Obtenido de http://erre-que-erre-
paco.blogspot.com/2016/12/diferentes-sumas-de-cuadrados-en-
anova.html#:~:text=Las%20sumas%20de%20cuadrados%20tipo,se%20han
%20tenido%20en%20cuenta.

es.quish.tv. (s.f.). ¿Qué es el modelo ARIMA y SARIMA? Obtenido de


https://es.quish.tv/what-is-arima-sarima-model

Ferrero, R. (Octubre de 2017). SELECCIÓN PASO A PASO E IMPORTANCIA DE


LOS PREDICTORES. Obtenido de https://www.maximaformacion.es/blog-
dat/seleccion-paso-a-paso-e-importancia-de-los-predictores/

Molinero, L. (Octubre de 2013). ¿Qué es el método de estimación de máxima


verosimilitud y cómo se interpreta? Obtenido de
https://www.alceingenieria.net/bioestadistica/maxverosim.pdf

Roldán, P. N. (26 de Agosto de 2018). Modelo econométrico. Obtenido de


Economipedia.com: https://economipedia.com/definiciones/modelo-
econometrico.html#:~:text=Un%20modelo%20econom%C3%A9trico%20es
%20un,valor%20futuro%20de%20las%20variables.

support.minitab.com. (s.f.). Interpretar los resultados clave para la ANOVA de un


solo factor. Obtenido de https://support.minitab.com/es-mx/minitab/18/help-
and-how-to/modeling-statistics/anova/how-to/one-way-anova/interpret-the-
results/key-results/

TIBCO. (s.f.). ¿Qué es Análisis de la Varianza (ANOVA)? Obtenido de


https://www.tibco.com/es/reference-center/what-is-analysis-of-variance-
anova

Valencia, M., Ramírez, S., Tabares, J., & Velásquez, C. (2014). MÉTODOS DE
PRONÓSTICOS - CLÁSICOS Y BAYESIANOS CON APLICACIONES.

También podría gustarte