Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PRACTICAS 1 Y 2 – SEMANA 14
ANÁLISIS DE REGRESIÓN II
ALUMNOS
ASESORES:
GRUPO:
N°03
TAREA 01 – SEMANA 14
Ejercicio 1:
¿Qué es y para qué sirve la transformación Box-Cox? ¿Qué expresión se usa?
Sol:
Ejercicio 2:
Explique lo referente a la familia de transformaciones de Box-Cox e identifique la
correspondiente función de verosimilitud.
Sol:
Si se quieren transformar los datos para conseguir normalidad, el mejor método para
estimar el parámetro es el de máxima verosimilitud y se calcula como sigue: para
diferentes valores de se realiza la transformación:
2
INGENIERÍA
Ejercicio 3:
Explique lo relacionado al valor de lambda en la transformación de Box-Cox
correspondiente a los casos especiales.
Sol:
3
INGENIERÍA
Otro (ingrese un valor entre -5 y 5): Utilice un valor especificado para lambda.
Otras transformaciones comunes son el cuadrado (λ = 2), la raíz cuadrada
inversa (λ = −0,5) y la inversa (λ = −1). En la mayoría de los casos, no se debe
usar un valor fuera del rango de −2 y 2.
Ejercicio 4:
Explique los pasos a seguir en el uso de Box Cox con la aplicación del programa
“MINITAB”.
Sol:
4
INGENIERÍA
Ejercicio 6:
Explique los pasos a seguir en el uso de Box Cox con la aplicación del programa
STATGRAPHICS.
Sol:
El archivo plasma.sf3 contiene datos presentados por Neter et al. (1998) que
muestran el nivel de plasma de polaminos para n = 25 niños sanos. Una porción de
los datos se muestra abajo:
5
INGENIERÍA
6
INGENIERÍA
El grafico incluye:
7
INGENIERÍA
como exactamente uno podría predecir donde mentiría una nueva observación. Sin
importar el tamaño de muestra, las nuevas observaciones varían alrededor de la
verdadera línea.
Las líneas verticales se dibujan en λ1 calculado y sus límites de confianza. Note que
el CME alcanza un mínimo cercano a λ1 = –0.5, aunque es relativamente plano con
una región amplia alrededor del valor óptimo, indicando que la potencia puede
cambiarse a otros valores sin afectar sustancialmente el modelo.
8
INGENIERÍA
Ejercicio 7:
Ver el link y explique lo referente a la transformación de Box-Cox: La transformación
de box-cox. mayo 2014
Sol:
LA TRANSFORMACIÓN BOX-COX
Para la serie original X de longitud N
Donde
Como puede ver, esta transformación solo tiene un parámetro lambda. Si el valor de
lambda es igual a cero, se lleva a cabo la transformación logarítmica de la serie inicial,
y si dicho valor es distinto a cero la transformación es potencial. Si el parámetro
lambda es igual a uno, la ley de distribución de la serie inicial permanece sin cambios,
aunque la serie cambia, ya que se resta una unidad a cada uno de sus valores.
9
INGENIERÍA
Para que la ley de distribución de la serie resultante sea tan cercana a la distribución
normal como sea posible, debe seleccionarse el valor óptimo del parámetro lambda.
10
INGENIERÍA
transformación seleccionada. Por tanto, sería una buena idea en cualquier caso no
excederse de un rango razonable a la hora de calcular el valor lambda.
SERIES ALEATORIAS
Se usa una serie pseudoaleatoria con una ley de distribución exponencial como datos
transformados.
Se utiliza la clase RNDXor128 para la generación de una serie pseudoaleatoria.
Luego se crea la serie de entrada, se desplaza al área de los valores positivos y se
lleva a cabo la búsqueda del valor óptimo del parámetro lambda.
Al escribir este artículo se seleccionó el tipo de análisis descrito en el artículo
"Análisis de las principales características de las series de tiempo" [6] para la
evaluación de los resultados de la transformación. A continuación, solo se muestran
los resultados gráficos del análisis realizado.
11
INGENIERÍA
Ejercicio 8:
Ver el link y explique el contenido de las pág. 34-38: Contraste de la normalidad
basado en la transformación Box-Cox. Peña
Sol:
donde yi(λ) viene dado por (2.1). La función soporte de las observaciones será:
Podemos simplificar la función soporte haciendo el Jacobiano de transformación
independiente de λ. Si en lugar de (2.1) tomamos:
Donde:
12
INGENIERÍA
Donde:
Siendo:
Por tanto, el máximo de L(λ) se produce cuando la covarianza entre las variables ei(λ)
y xi(λ) es cero y el valor de la derivada (2.6) es precisamente la estimación del
coeficiente de regresión entre las variables ei(λ) y xi(λ).
La estimación óptima de λ puede llevarse a la práctica fácilmente utilizando un
algoritmo tipo Gauss-Newton, de acuerdo con el esquema iterativo:
13
INGENIERÍA
Que es equivalente a:
Ejercicio 9:
Ver el link y explique el contenido: Transformaciones de Box-Cox STATGRAPHICS –
Rev. 9/14/2006
Sol:
Transformación de Box-Cox
Es diseñado para determinar una transformación óptima para Y mientras se estima
un modelo de regresión lineal. Es muy útil cuando la variabilidad de Y cambia como
una función de X. A menudo, una apropiada transformación de Y estabiliza la
variabilidad y produce que las desviaciones alrededor del modelo sean más
normalmente distribuidas.
La clase de transformaciones consideradas son transformaciones de potencia
definidas por:
en la cual los datos son calculados en una potencia de λ1 después de cambiarlo a una
cierta cantidad λ2. Posteriormente, el parámetro de cambio λ2 se fija igual a 0. Esta
clase incluyen raíces cuadradas, logaritmos, recíprocos, y otras transformaciones
comunes, que dependen sobre una potencia. Los ejemplos incluyen:
14
INGENIERÍA
15
INGENIERÍA
El grafico incluye:
16
INGENIERÍA
el límite de predicción estos son los límites externos del gráfico anterior y describen
como exactamente uno podría predecir donde mentiría una nueva observación. Sin
importar el tamaño de muestra, las nuevas observaciones varían alrededor de la
verdadera línea.
Las líneas verticales se dibujan en λ1 calculado y sus límites de confianza. Note que
el CME alcanza un mínimo cercano a λ1 = –0.5, aunque es relativamente plano con
una región amplia alrededor del valor óptimo, indicando que la potencia puede
cambiarse a otros valores sin afectar sustancialmente el modelo.
17
INGENIERÍA
Ejercicio 10:
Ver el link y explique el contenido: Una estimación no paramétrica y robusta de la
transformación Box-Cox para el modelo de regresión
Sol:
INTRODUCCIÓN:
El análisis de regresión lineal clásico se basa en los supuestos de que el término de
error es aditivo, sigue una distribución normal y tiene varianza constante. Cuando
estas hipótesis son seriamente violadas, se sugieren diferentes alternativas a seguir:
Ignorar la violación de los supuestos y proceder como si fueran válidos.
Analizar cuál es el supuesto adecuado y usar un procedimiento válido que lo
tenga en cuenta.
Diseñar un nuevo modelo que tenga las características importantes del
modelo original y satisfaga todos los supuestos, por medio de la aplicación de
una transformación adecuada a los datos o filtrado algunos datos que
parecen sospechosos de ser atípicos.
Usar un procedimiento a distribución libre que sea válido aun cuando varios
supuestos son violados.
La opción iii) es frecuentemente el camino elegido por muchos investigadores y
generalmente la transformación de Box y Cox es utilizada con el objetivo de que los
supuestos de aditividad, normalidad y varianza constante sean satisfechos
aproximadamente. Sin embargo, dicho procedimiento no es robusto y puede verse
afectado ante la existencia de observaciones atípicas en los datos. En esta situación,
autores proponen estimadores robustos para el parámetro de transformación,
reemplazando la verosimilitud normal con una función objetivo que es menos
sensible a las observaciones atípicas. Este artículo presenta un procedimiento
alternativo no paramétrico y robusto que permite obtener la transformación de
potencia en la familia de transformaciones de Box y Cox cuando existen
observaciones atípicas en la variable dependiente. El procedimiento es una
extensión de la propuesta de Castaño (1994, 1995) de una transformación de
simetría para un conjunto de datos.
18
INGENIERÍA
METODOLOGÍA
a. El procedimiento de Box y Cox
La transformación de Box y Cox trata de estimar el parámetro λ de una
transformación potencial sobre la variable dependiente del modelo de
regresión lineal:
Donde:
b. El procedimiento propuesto
El procedimiento que se propone trata de obtener una transformación λ en
la familia de transformaciones de potencia de Box y Cox de forma tal que en
el modelo:
19
INGENIERÍA
Y defina la función:
20
INGENIERÍA
EXPERIMENTO DE MONTECARLOS
En este apartado nos dicen que se hicieron 100, 250 y 1000 observaciones para la
estimación de lambda (λ) habiendo o no observaciones atípicas.
En el caso 1. Era sobre que no había observaciones atípicas. Y se
generaron observaciones al azar para el modelo.
21
INGENIERÍA
Para los experimentos realizados, los resultados muestran que cuando existen
observaciones atípicas, en general, el método propuesto es más preciso y produce
menos sesgos que el método de Box y Cox y que la búsqueda directa por medio de
la regresión robusta LAD. También se observa que a medida que el tamaño muestral
crece, los sesgos decrecen y estimador propuesto converge al parámetro
desconocido, exhibiendo la propiedad de consistencia del nuevo estimador para λ.
En muestras pequeñas, el procedimiento LAD tiene un comportamiento un poco más
malo que el de Box y Cox, aunque es mejor a medida que el tamaño muestral crece.
CONCLUSIONES
Para los casos estudiados se pueden extraer las siguientes conclusiones.
El procedimiento de Box-Cox es sensible a la presencia de observaciones
atípicas en la variable respuesta. El procedimiento propuesto proporciona
un estimador más eficiente que el procedimiento de Box-Cox y que el de la
búsqueda directa empleando la regresión LAD.
Cuando no existen observaciones atípicas, como era de esperar, es más
eficiente el procedimiento de Box-Cox, seguido de lejos por la búsqueda
directa usando regresión LAD.
Para muestras pequeñas la regresión LAD y el procedimiento de Box- Cox
obtienen resultados similares, con una ligera ventaja de Box-Cox. Sin
embargo, a medida que el tamaño muestral crece, la regresión LAD presenta
mejor comportamiento que el procedimiento de Box-Cox.
El nuevo procedimiento disminuye sesgos y aumenta precisión a medida
que el tamaño muestral crece.
22
INGENIERÍA
Ejercicio 11:
Ver el link y explique el contenido: pág. 30-32. Análisis de la metodología Box-Cox
para medir la resistividad del terreno
Sol:
METODOLOGIA TRANSFORMACIÓN DE BOX COX
Para calcular el valor de la resistividad del terreno necesario para el diseño de un
sistema de puesta a tierra existen métodos donde se supone que el terreno es de
una sola capa o de n capas. Se considera que el modelamiento del suelo como
homogéneo es adecuado cuando los diversos valores medidos no se apartan en más
de un 30% del valor máximo. Cuando se aplica el método unicapa, se asume que el
terreno es homogéneo es por tanto que se requiere un único valor de resistividad,
en este caso la metodología box Cox es aplicable porque permite calcular un solo
valor de resistividad con una probabilidad del 70%.
23
INGENIERÍA
Nota: Este cálculo se realizó con los valores promedios a una misma separación de
los electrodos.
Tabla 4: Cálculo del valor de la resistividad para el punto 3 con todos los valores
obtenidos en el método de Wenner.
24
INGENIERÍA
Nota: Todos los valores obtenidos con el Método de Wenner se usan como conjunto
de datos para estimar el valor de resistividad utilizando de la metodología
Transformación Box-Cox.
25