Tarea Semana 14 - Grupo 3 - Analisis de Regresión Ii

“UNIVERSIDAD NACIONAL DE TRUJILLO”
FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS

ESCUELA PROFESIONAL DE ESTADÍSTICA
PRACTICAS 1 Y 2 – SEMANA 14
ANÁLISIS DE REGRESIÓN II
ALUMNOS
GARCIA ROSAS, Cinthia Verónica
ZAVALA VERA, Alejandro Enrique
ASESORES:
Lic. IPANAQUÉ CENTENO, Enrique
GRUPO:
N°03
TRUJILLO – PERÚ 2023

INGENIERÍA
TAREA 01 – SEMANA 14
Ejercicio 1:
¿Qué es y para qué sirve la transformación Box-Cox? ¿Qué expresión se usa?
Sol:
Las transformaciones Box-Cox se conocen como de Potencial, esta transformación

son una familia de transformaciones potenciales usadas en estadística para corregir
sesgos en la distribución de errores, para corregir varianzas desiguales (para
diferentes valores de la variable predictora) y principalmente para corregir la no
linealidad en la relación (mejorar correlación entre las variables). Esta
transformación recibe el nombre de los estadísticos George E. P. Box y David Cox.
Para transformar los datos, la fórmula de Box-Cox se escribe como:
Ejercicio 2:
Explique lo referente a la familia de transformaciones de Box-Cox e identifique la
correspondiente función de verosimilitud.
Sol:
La familia de transformaciones más utilizada para resolver los problemas de falta de

normalidad y de heterocedasticidad es la familia de Box-Cox, cuya definición es la
siguiente.
Se desea transformar la variable Y, cuyos valores muestrales se suponen positivos,

en caso contrario se suma una cantidad fija M tal que Y + M >0. La transformación
de Box-Cox depende de un parámetro por determinar y viene dada por:
Si se quieren transformar los datos para conseguir normalidad, el mejor método para
estimar el parámetro es el de máxima verosimilitud y se calcula como sigue: para
diferentes valores de se realiza la transformación:
2
INGENIERÍA
Siendo 𝑦̃ la media geométrica de la variable Y.

Para cada 
, se obtiene el conjunto de valores U i   n
i 1
La función de verosimilitud es:
Se elige el parámetro que maximiza L .
Ejercicio 3:
Explique lo relacionado al valor de lambda en la transformación de Box-Cox
correspondiente a los casos especiales.
Sol:
La transformación de Box-Cox estima un valor de lambda, como se muestra en la

siguiente tabla, que minimiza la desviación estándar de una variable transformada
estandarizada. La transformación resultante es Yλ cuando λ ҂ 0 y ln Y cuando λ = 0.
El método de Box-Cox busca entre muchos tipos de transformaciones. La siguiente

tabla muestra algunas transformaciones comunes donde Y' es la transformación de
los datos Y.
Transformación de potencia de Box-Cox (W = Y^λ)

Seleccione el valor de lambda (λ) que Minitab utiliza para transformar los datos.
Usar λ óptimo: Utilice el valor óptimo de lambda, que debe producir la
transformación con el mejor ajuste. Minitab redondea la lambda óptima a 0,5
o al entero más cercano.
Nota:
Para utilizar un valor exacto en lugar de un valor redondeado de λ óptima, elija
Archivo > Opciones > Gráficas de control y herramientas de calidad > Otros y
desmarque Usar valores redondeados para las transformaciones de Box-Cox
cuando sea posible.
λ = 0 (ln): Utilice el logaritmo natural de los datos.
λ = 0.5 (raíz cuadrada): Utilice la raíz cuadrada de los datos.
3
INGENIERÍA
Otro (ingrese un valor entre -5 y 5): Utilice un valor especificado para lambda.
Otras transformaciones comunes son el cuadrado (λ = 2), la raíz cuadrada
inversa (λ = −0,5) y la inversa (λ = −1). En la mayoría de los casos, no se debe
usar un valor fuera del rango de −2 y 2.
Ejercicio 4:
Explique los pasos a seguir en el uso de Box Cox con la aplicación del programa
“MINITAB”.
Sol:
Los pasos a seguir son los siguientes:
1) Se ingresan los datos en Minitab para verificar si se distribuyen normalmente.

2) Se obtiene el gráfico de histograma para ver si los datos de la variable “Nivel
de desperdicio” cumplen una Distribución Normal.
Ruta:
Grafica Histograma…
Histogramas: “Con ajuste” Aceptar
Variables de Graficas
Aceptar
Ruta: Pruebas de Normalidad:
Estadísticas - Estadísticas básicas - Prueba de normalidad…

Variable:
4
INGENIERÍA
Pruebas de normalidad: “Anderson Darling”; “Ryan Joiner”;

Aceptar
3) Si los datos insertados en el programa MINITAB no tienen una distribución
Normal: Se realiza la transformación de Box.
Ruta:
Estadísticas - Grafico de control - Transformación Box Cox…
Transformación Box Cox: Tamaños de los Subgrupos: 1
Aceptar
4) Se realiza la modificación de la variable Nueva Variable “New_ X”.
Ruta:
Calc - Calculadora…
Almacenar resultados en variable: X
Expresión: “ln (X)”
Aceptar
5) Con la variable Y modificada, es decir “X”
Repetimos el paso 2.
Y así obtenemos los siguientes resultados
Se obtiene el Histograma para ver si los datos tienen distribución
Normal y las pruebas de Normalidad.
6) Aplicando las Transformaciones BoxCox a la variable “X”, y se observa que se

asemeje a una distribución normal.
Corroborándolo con los test de normalidad ya que estos resultaron
mayores del 5% de alfa, es decir:
Ejercicio 6:
Explique los pasos a seguir en el uso de Box Cox con la aplicación del programa
STATGRAPHICS.
Sol:
El archivo plasma.sf3 contiene datos presentados por Neter et al. (1998) que
muestran el nivel de plasma de polaminos para n = 25 niños sanos. Una porción de
los datos se muestra abajo:
5
INGENIERÍA
Es deseable determinar un modelo relacionando el nivel de plasma para la edad de

los niños.
PASOS:
1) Entrada de datos
La caja de dialogo para la entrada de datos requiere los nombres de las columnas
que contienen la variable dependiente Y y la variable independiente X:
Y: Columna numérica que contiene las n observaciones para la variable

dependiente Y.
X: Columna numérica que contiene las n observaciones para la variable
independiente X.
Selección: Selección de un subconjunto de los datos.
2) Resumen del análisis
6
INGENIERÍA
3) Gráfico del Modelo Estimado
El grafico incluye:
La línea del mejor ajuste o ecuación de predicción, intervalos de confianza y límites

de predicción, en el caso de la ecuación de predicción se nota que se realiza un
trabajo relativamente bueno al tomar el incremento de la variabilidad del Nivel de
Plasma sobre Edades bajas, así como la relación de la curvatura. En los intervalos de
confianza estos son los límites interiores en el gráfico anterior y describen que tan
bien la localización de la línea fue estimada dada la muestra disponible de los datos.
Como el tamaño de n incrementa, estos límites llegarán a ser más apretados
También debemos notar que la anchura de los límites varia como una función de X,
con la línea estimada lo más exacto posible cerca del valor promedio y finalmente en
el límite de predicción estos son los límites externos del gráfico anterior y describen
7
INGENIERÍA
como exactamente uno podría predecir donde mentiría una nueva observación. Sin
importar el tamaño de muestra, las nuevas observaciones varían alrededor de la
verdadera línea.
4) Gráfico de comparación CME

Al optimizar la transformación, la potencia se reduce al mínimo sobre el cuadrado
medio del error del ajuste de W como una función de X. Para ilustrar el resultado de
la búsqueda, el Gráfico de Comparación CME presenta el cuadrado medio del error
en la vecindad del valor óptimo:
Las líneas verticales se dibujan en λ1 calculado y sus límites de confianza. Note que
el CME alcanza un mínimo cercano a λ1 = –0.5, aunque es relativamente plano con
una región amplia alrededor del valor óptimo, indicando que la potencia puede
cambiarse a otros valores sin afectar sustancialmente el modelo.
5) Gráfico de Sesgo y Curtosis

Este gráfico presenta los valores estandarizados del sesgo y la curtosis como una
función del parámetro de potencia λ1.
8
INGENIERÍA
La estandarización del sesgo y la curtosis se presenta para ambas entre –2 y +2 para

una transformación adecuada a los datos normalizados. El gráfico muestra una línea
horizontal entre –2 y +2, con la línea vertical indicando el valor óptimo de λ1 y sus
límites de confianza. Claramente, hay un amplio rango de valores para λ1 que crearía
una transformación razonable de los datos.
Ejercicio 7:
Ver el link y explique lo referente a la transformación de Box-Cox: La transformación
de box-cox. mayo 2014
Sol:
LA TRANSFORMACIÓN BOX-COX
Para la serie original X de longitud N
La transformación Box-Cox de un parámetro es la siguiente:
Donde
Como puede ver, esta transformación solo tiene un parámetro lambda. Si el valor de
lambda es igual a cero, se lleva a cabo la transformación logarítmica de la serie inicial,
y si dicho valor es distinto a cero la transformación es potencial. Si el parámetro
lambda es igual a uno, la ley de distribución de la serie inicial permanece sin cambios,
aunque la serie cambia, ya que se resta una unidad a cada uno de sus valores.
En función del valor de lambda, la transformación de Box-Cox incluye los siguientes

casos especiales:
9
INGENIERÍA
La utilización de la transformación Box-Cox requiere que todos los valores de la serie

de entrada sean positivos y distintos a cero. Si la serie de entrada no satisface estos
requisitos puede ser desplazada al área positiva por el volumen que garantiza un
valor "positivo" de todos sus valores.
De hecho, no es necesario aplicar este desplazamiento a las series "positivas". No
obstante, usaremos el mismo algoritmo para disminuir la probabilidad de obtener
valores demasiado altos al elevar a una potencia durante la transformación. De esta
forma, cualquier serie de entrada se situará en el área positiva después del cambio
y tendrá el valor más bajo cercano a cero.
La Figura 1 muestra las curvas de la transformación de Box-Cox con valores distintos
del parámetro lambda. La Figura 1 se ha obtenido del artículo. La cuadrícula
horizontal en el gráfico se muestra en una escala logarítmica.
Como vemos, las "colas" de la distribución inicial pueden "estirarse" o "contraerse".

La curva superior de la Figura 1 se corresponde con lambda = 3, mientras que la
inferior lo hace con lambda = -2.
Para que la ley de distribución de la serie resultante sea tan cercana a la distribución
normal como sea posible, debe seleccionarse el valor óptimo del parámetro lambda.
TRANSFORMACIÓN EN UNA LEY DE DISTRIBUCIÓN NORMAL
Una de las tareas más importantes de la transformación Box-Cox es la reducción de

la ley de distribución de la serie de entrada a una forma "normal".
Para evitar cualquier distracción y repetición innecesaria usaremos el algoritmo de
búsqueda del mínimo de la función por el método de Powell.
Si obtenemos valores de lambda demasiado grandes o demasiado pequeños durante
la optimización, esto puede indicar que la serie es de poca utilidad para el tipo de
10
INGENIERÍA
transformación seleccionada. Por tanto, sería una buena idea en cualquier caso no
excederse de un rango razonable a la hora de calcular el valor lambda.
SERIES ALEATORIAS
Se usa una serie pseudoaleatoria con una ley de distribución exponencial como datos
transformados.
Se utiliza la clase RNDXor128 para la generación de una serie pseudoaleatoria.
Luego se crea la serie de entrada, se desplaza al área de los valores positivos y se
lleva a cabo la búsqueda del valor óptimo del parámetro lambda.
Al escribir este artículo se seleccionó el tipo de análisis descrito en el artículo
"Análisis de las principales características de las series de tiempo" [6] para la
evaluación de los resultados de la transformación. A continuación, solo se muestran
los resultados gráficos del análisis realizado.
La Figura 2 muestra el histograma y el gráfico proporcionados por la escala de

distribución normal para la serie seudoaleatoria con una ley de distribución
exponencial. La prueba de Jarque-Bera da como resultado p=0,000. Como podemos
ver, la serie de entrada no es normal en absoluto y, tal y como era de esperar, su
distribución es similar a la exponencial.
La Figura 3 muestra el resultado del análisis de la serie transformada (script

BoxCoxTest1.mq5, matriz bcdat[]). La ley de distribución de la serie transformada
está mucho más cerca de la norma, lo que también se confirma a partir los resultados
11
INGENIERÍA
de la prueba de Jarque-Bera JB=4.73, р=0.094. El valor del parámetro lambda

obtenido es 0,2779.
Ejercicio 8:
Ver el link y explique el contenido de las pág. 34-38: Contraste de la normalidad
basado en la transformación Box-Cox. Peña
Sol:
Deducción del contraste de normalidad
Dada una variable aleatoria, y, Box y Cox han propuesto la familia de

transformaciones:
donde λ y m son parámetros a estimar. La familia es continua en λ y ha sido

extensamente utilizada para obtener homocedasticidad, linealidad y normalidad en
modelos estadísticos.
En este trabajo supondremos que y es un vector de variables aleatorias con
componentes:
donde yi(λ) viene dado por (2.1). La función soporte de las observaciones será:
Podemos simplificar la función soporte haciendo el Jacobiano de transformación
independiente de λ. Si en lugar de (2.1) tomamos:
Donde:
12
INGENIERÍA
es la media geométrica de las observaciones, la función soporte se reduce a:
que concentrada con respecto a σ2 y μ' queda finalmente:
donde Z(λ) es la media aritmética de los valores transformados Zi(λ).

El máximo de esta función será:
Donde:
Siendo:
Por tanto, el máximo de L(λ) se produce cuando la covarianza entre las variables ei(λ)
y xi(λ) es cero y el valor de la derivada (2.6) es precisamente la estimación del
coeficiente de regresión entre las variables ei(λ) y xi(λ).
La estimación óptima de λ puede llevarse a la práctica fácilmente utilizando un
algoritmo tipo Gauss-Newton, de acuerdo con el esquema iterativo:
Con este desarrollo puede plantearse a continuación un test de normalidad, en el

cual la hipótesis nula será λ0 = 1.0. Supongamos que mediante iteraciones tipo (2,9)
se ha obtenido λ1 como valor maximoverosímil de λ.
El test de razón de verosimilitud de la hipótesis nula de datos gaussianos, está
definido por la región crítica:
13
INGENIERÍA
Que es equivalente a:
y obtenemos un test asintótico inmediato, que además nos proporciona un intervalo

de confianza aproximado para el valor estimado λ1.
Ejercicio 9:
Ver el link y explique el contenido: Transformaciones de Box-Cox STATGRAPHICS –
Rev. 9/14/2006
Sol:
Transformación de Box-Cox
Es diseñado para determinar una transformación óptima para Y mientras se estima
un modelo de regresión lineal. Es muy útil cuando la variabilidad de Y cambia como
una función de X. A menudo, una apropiada transformación de Y estabiliza la
variabilidad y produce que las desviaciones alrededor del modelo sean más
normalmente distribuidas.
La clase de transformaciones consideradas son transformaciones de potencia
definidas por:
en la cual los datos son calculados en una potencia de λ1 después de cambiarlo a una
cierta cantidad λ2. Posteriormente, el parámetro de cambio λ2 se fija igual a 0. Esta
clase incluyen raíces cuadradas, logaritmos, recíprocos, y otras transformaciones
comunes, que dependen sobre una potencia. Los ejemplos incluyen:
14
INGENIERÍA
Note que si λ1 → 0, la transformación de potencia se enfoca en un logaritmo.

Ejemplo:
El archivo plasma.sf3 contiene datos presentados por Neter et al. (1998) que
muestran el nivel de plasma de polaminos para n = 25 niños sanos. Una porción de
los datos se muestra abajo:
Es deseable determinar un modelo relacionando el nivel de plasma para la edad de

los niños.
PASOS:
6) Entrada de datos
La caja de dialogo para la entrada de datos requiere los nombres de las columnas
que contienen la variable dependiente Y y la variable independiente X:
Y: Columna numérica que contiene las n observaciones para la variable

dependiente Y.
X: Columna numérica que contiene las n observaciones para la variable
independiente X.
Selección: Selección de un subconjunto de los datos.
15
INGENIERÍA
7) Resumen del análisis
8) Gráfico del Modelo Estimado
El grafico incluye:
La línea del mejor ajuste o ecuación de predicción, intervalos de confianza y límites

de predicción, en el caso de la ecuación de predicción se nota que se realiza un
trabajo relativamente bueno al tomar el incremento de la variabilidad del Nivel de
Plasma sobre Edades bajas, así como la relación de la curvatura. En los intervalos de
confianza estos son los límites interiores en el gráfico anterior y describen que tan
bien la localización de la línea fue estimada dada la muestra disponible de los datos.
Como el tamaño de n incrementa, estos límites llegarán a ser más apretados
También debemos notar que la anchura de los límites varia como una función de X,
con la línea estimada lo más exacto posible cerca del valor promedio y finalmente en
16
INGENIERÍA
el límite de predicción estos son los límites externos del gráfico anterior y describen
como exactamente uno podría predecir donde mentiría una nueva observación. Sin
importar el tamaño de muestra, las nuevas observaciones varían alrededor de la
verdadera línea.
9) Gráfico de comparación CME

Al optimizar la transformación, la potencia se reduce al mínimo sobre el cuadrado
medio del error del ajuste de W como una función de X. Para ilustrar el resultado de
la búsqueda, el Gráfico de Comparación CME presenta el cuadrado medio del error
en la vecindad del valor óptimo:
Las líneas verticales se dibujan en λ1 calculado y sus límites de confianza. Note que
el CME alcanza un mínimo cercano a λ1 = –0.5, aunque es relativamente plano con
una región amplia alrededor del valor óptimo, indicando que la potencia puede
cambiarse a otros valores sin afectar sustancialmente el modelo.
10) Gráfico de Sesgo y Curtosis

Este gráfico presenta los valores estandarizados del sesgo y la curtosis como una
función del parámetro de potencia λ1.
17
INGENIERÍA
La estandarización del sesgo y la curtosis se presenta para ambas entre –2 y +2 para

una transformación adecuada a los datos normalizados. El gráfico muestra una línea
horizontal entre –2 y +2, con la línea vertical indicando el valor óptimo de λ1 y sus
límites de confianza. Claramente, hay un amplio rango de valores para λ1 que crearía
una transformación razonable de los datos.
Ejercicio 10:
Ver el link y explique el contenido: Una estimación no paramétrica y robusta de la
transformación Box-Cox para el modelo de regresión
Sol:
INTRODUCCIÓN:
El análisis de regresión lineal clásico se basa en los supuestos de que el término de
error es aditivo, sigue una distribución normal y tiene varianza constante. Cuando
estas hipótesis son seriamente violadas, se sugieren diferentes alternativas a seguir:
Ignorar la violación de los supuestos y proceder como si fueran válidos.
Analizar cuál es el supuesto adecuado y usar un procedimiento válido que lo
tenga en cuenta.
Diseñar un nuevo modelo que tenga las características importantes del
modelo original y satisfaga todos los supuestos, por medio de la aplicación de
una transformación adecuada a los datos o filtrado algunos datos que
parecen sospechosos de ser atípicos.
Usar un procedimiento a distribución libre que sea válido aun cuando varios
supuestos son violados.
La opción iii) es frecuentemente el camino elegido por muchos investigadores y
generalmente la transformación de Box y Cox es utilizada con el objetivo de que los
supuestos de aditividad, normalidad y varianza constante sean satisfechos
aproximadamente. Sin embargo, dicho procedimiento no es robusto y puede verse
afectado ante la existencia de observaciones atípicas en los datos. En esta situación,
autores proponen estimadores robustos para el parámetro de transformación,
reemplazando la verosimilitud normal con una función objetivo que es menos
sensible a las observaciones atípicas. Este artículo presenta un procedimiento
alternativo no paramétrico y robusto que permite obtener la transformación de
potencia en la familia de transformaciones de Box y Cox cuando existen
observaciones atípicas en la variable dependiente. El procedimiento es una
extensión de la propuesta de Castaño (1994, 1995) de una transformación de
simetría para un conjunto de datos.
18
INGENIERÍA
METODOLOGÍA
a. El procedimiento de Box y Cox
La transformación de Box y Cox trata de estimar el parámetro λ de una
transformación potencial sobre la variable dependiente del modelo de
regresión lineal:
Donde:
es la familia de transformaciones de potencia de Box y Cox. La transformación

estimada se obtiene por medio de la maximización de la verosimilitud normal.
donde y es un vector de nx1 con las observaciones de la variable dependiente,

y(λ) es un vector de nx1 con las observaciones de la variable dependiente
transformadas por el parámetro λ, X es la matriz de nx(k+1) de diseño del
modelo de regresión lineal, β es el vector de (k+1)x1 que contiene los
parámetros del modelo, σ2 es la varianza del término de error del modelo y
J(λ,y) = ∏𝑛𝑖=1 𝑦𝑖𝜆−1 es el Jacobiano de la transformación de Box y Cox.
Aunque la transformación estimada posee las propiedades de los
estimadores máximos verosímiles, no es robusta a la presencia de
observaciones atípicas en la variable dependiente.
b. El procedimiento propuesto
El procedimiento que se propone trata de obtener una transformación λ en
la familia de transformaciones de potencia de Box y Cox de forma tal que en
el modelo:
el error εi sea aditivo, homocedástico y con distribución simétrica. El

procedimiento de búsqueda del estimador de λ consta de las siguientes
etapas:
19
INGENIERÍA
Defina un conjunto de valores para λ. Generalmente el valor de λ se

encuentra en el intervalo [-2, 2]. Para cada valor de λ elegido, estime
el modelo (1) usando regresión LAD y calcule los residuales ei(λ).
Obtenga los residuales normalizados como ein(λ)=ei(λ) / MAD(ei(λ)),
donde MAD = mediana{| ei(λ) − mediana{ ei(λ) } |}. Este procedimiento
elimina las diferentes unidades de medida en la función objetivo,
introducidas al ir cambiando λ.
Calcule los percentiles muestrales p ξp(λ) y ξp-1(λ) de los ein(λ) para
varios valores de p, 0<p<1. Obtenga
Y defina la función:
Bajo el supuesto de que la transformación λ simetriza la distribución de

los errores,
Por tanto, el valor 𝜆̂ que minimiza a SA(λ) es la transformación de potencia

en la familia de transformaciones de Box-Cox que simetriza la distribución
de los errores. Para el caso de una muestra aleatoria, Castaño (1995)
muestra 𝜆̂ es un estimador consistente.
c. Obtención del error estándar de la transformación estimada

Para el cálculo del error estándar se emplea la técnica del Bootstrap (ver, por
ejemplo, Efron y Tibshirani, 1986). El procedimiento es el siguiente:
Obtenga la transformación 𝜆̂ y calcule los residuales ei, i=1, 2, …, n, de
la regresión estimada:
Obtenga una muestra aleatoria de tamaño n usando muestreo

reemplazamiento de los residuales 𝑒𝑖 . Sean 𝑒𝑖∗ los residuales
obtenidos. Construya los pseudos datos para la variable dependiente
𝑦𝑖 como:
20
INGENIERÍA
Use el procedimiento descrito para estimar λ en el modelo con los

pseudo datos:
EXPERIMENTO DE MONTECARLOS
En este apartado nos dicen que se hicieron 100, 250 y 1000 observaciones para la
estimación de lambda (λ) habiendo o no observaciones atípicas.
En el caso 1. Era sobre que no había observaciones atípicas. Y se
generaron observaciones al azar para el modelo.
En el caso 2. Hay observaciones atípicas. Se generaron observaciones

para el mismo modelo anterior, pero en el término de error se
generaron 5 observaciones atípicas usando la distribución N(0,25) .
Y se obtuvieron resultados que presentas los resultados de la estimación de lambda

(λ) por medio de transformación Box y Cox, usando regresión robusta (LAD) y usando
el método propuesto (que busca que el error sea aditivo, homocedástico y con
distribución simétrica.
21
INGENIERÍA
Para los experimentos realizados, los resultados muestran que cuando existen
observaciones atípicas, en general, el método propuesto es más preciso y produce
menos sesgos que el método de Box y Cox y que la búsqueda directa por medio de
la regresión robusta LAD. También se observa que a medida que el tamaño muestral
crece, los sesgos decrecen y estimador propuesto converge al parámetro
desconocido, exhibiendo la propiedad de consistencia del nuevo estimador para λ.
En muestras pequeñas, el procedimiento LAD tiene un comportamiento un poco más
malo que el de Box y Cox, aunque es mejor a medida que el tamaño muestral crece.
CONCLUSIONES
Para los casos estudiados se pueden extraer las siguientes conclusiones.
El procedimiento de Box-Cox es sensible a la presencia de observaciones
atípicas en la variable respuesta. El procedimiento propuesto proporciona
un estimador más eficiente que el procedimiento de Box-Cox y que el de la
búsqueda directa empleando la regresión LAD.
Cuando no existen observaciones atípicas, como era de esperar, es más
eficiente el procedimiento de Box-Cox, seguido de lejos por la búsqueda
directa usando regresión LAD.
Para muestras pequeñas la regresión LAD y el procedimiento de Box- Cox
obtienen resultados similares, con una ligera ventaja de Box-Cox. Sin
embargo, a medida que el tamaño muestral crece, la regresión LAD presenta
mejor comportamiento que el procedimiento de Box-Cox.
El nuevo procedimiento disminuye sesgos y aumenta precisión a medida
que el tamaño muestral crece.
22
INGENIERÍA
La nueva transformación parece ser útil en muestras moderadas y grandes.
Ejercicio 11:
Ver el link y explique el contenido: pág. 30-32. Análisis de la metodología Box-Cox
para medir la resistividad del terreno
Sol:
METODOLOGIA TRANSFORMACIÓN DE BOX COX
Para calcular el valor de la resistividad del terreno necesario para el diseño de un
sistema de puesta a tierra existen métodos donde se supone que el terreno es de
una sola capa o de n capas. Se considera que el modelamiento del suelo como
homogéneo es adecuado cuando los diversos valores medidos no se apartan en más
de un 30% del valor máximo. Cuando se aplica el método unicapa, se asume que el
terreno es homogéneo es por tanto que se requiere un único valor de resistividad,
en este caso la metodología box Cox es aplicable porque permite calcular un solo
valor de resistividad con una probabilidad del 70%.
CÁLCULO DEL VALOR APROXIMADO PARA LA RESISTIVIDAD

Para el cálculo de este parámetro se emplea el método probabilístico
(transformación de Box Cox), para lo cual se tomará una probabilidad del 70% como
aceptable para la asignación de la resistividad a partir del ajuste de distribución
normal.
Partiendo de los datos de resistividad obtenidos de las lecturas, aplica el siguiente
procedimiento:
Se halla el promedio de la resistividad aparente 𝑥𝑝.
Se tabulan los datos de resistividad aparente medida 𝜌𝑖.
En una columna se colocan los logaritmos naturales de cada una de las
medidas.
Se halla la resistividad promedio 𝑥̅ como:
En otra columna se coloca el resultado de (𝑥𝑖−𝑥̅)2

Se calcula la desviación estándar S como:
23
INGENIERÍA
De la distribución normal se toma Z para 70% de 0.524400513

Se halla la resistividad (con probabilidad del 70% de no ser superada) por la
siguiente fórmula:
Ejemplo 2: Aplicación de la metodología Box-Cox a los valores del Ejemplo 1.

Tabla 3. Calculo del valor de la resistividad para el punto 3 con los valores promedio
a una misma separación de electrodos.
Nota: Este cálculo se realizó con los valores promedios a una misma separación de
los electrodos.
Tabla 4: Cálculo del valor de la resistividad para el punto 3 con todos los valores
obtenidos en el método de Wenner.
24
INGENIERÍA
Nota: Todos los valores obtenidos con el Método de Wenner se usan como conjunto
de datos para estimar el valor de resistividad utilizando de la metodología
Transformación Box-Cox.
25

Tarea Semana 14 - Grupo 3 - Analisis de Regresión Ii

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tarea Semana 14 - Grupo 3 - Analisis de Regresión Ii

Cargado por

Copyright:

Formatos disponibles

“UNIVERSIDAD NACIONAL DE TRUJILLO”

FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS

GARCIA ROSAS, Cinthia Verónica

ZAVALA VERA, Alejandro Enrique

Lic. IPANAQUÉ CENTENO, Enrique

TRUJILLO – PERÚ 2023

Las transformaciones Box-Cox se conocen como de Potencial, esta transformación

Para transformar los datos, la fórmula de Box-Cox se escribe como:

La familia de transformaciones más utilizada para resolver los problemas de falta de

Se desea transformar la variable Y, cuyos valores muestrales se suponen positivos,

Siendo 𝑦̃ la media geométrica de la variable Y.

Se elige el parámetro que maximiza L .

La transformación de Box-Cox estima un valor de lambda, como se muestra en la

El método de Box-Cox busca entre muchos tipos de transformaciones. La siguiente

Transformación de potencia de Box-Cox (W = Y^λ)

Los pasos a seguir son los siguientes:

1) Se ingresan los datos en Minitab para verificar si se distribuyen normalmente.

Ruta: Pruebas de Normalidad:

Estadísticas - Estadísticas básicas - Prueba de normalidad…

Pruebas de normalidad: “Anderson Darling”; “Ryan Joiner”;

6) Aplicando las Transformaciones BoxCox a la variable “X”, y se observa que se

Es deseable determinar un modelo relacionando el nivel de plasma para la edad de

Y: Columna numérica que contiene las n observaciones para la variable

2) Resumen del análisis

3) Gráfico del Modelo Estimado

La línea del mejor ajuste o ecuación de predicción, intervalos de confianza y límites

4) Gráfico de comparación CME

5) Gráfico de Sesgo y Curtosis

La estandarización del sesgo y la curtosis se presenta para ambas entre –2 y +2 para

La transformación Box-Cox de un parámetro es la siguiente:

En función del valor de lambda, la transformación de Box-Cox incluye los siguientes

La utilización de la transformación Box-Cox requiere que todos los valores de la serie

Como vemos, las "colas" de la distribución inicial pueden "estirarse" o "contraerse".

TRANSFORMACIÓN EN UNA LEY DE DISTRIBUCIÓN NORMAL

Una de las tareas más importantes de la transformación Box-Cox es la reducción de

La Figura 2 muestra el histograma y el gráfico proporcionados por la escala de

La Figura 3 muestra el resultado del análisis de la serie transformada (script

de la prueba de Jarque-Bera JB=4.73, р=0.094. El valor del parámetro lambda

Deducción del contraste de normalidad

Dada una variable aleatoria, y, Box y Cox han propuesto la familia de

donde λ y m son parámetros a estimar. La familia es continua en λ y ha sido

es la media geométrica de las observaciones, la función soporte se reduce a:

que concentrada con respecto a σ2 y μ' queda finalmente:

donde Z(λ) es la media aritmética de los valores transformados Zi(λ).

Con este desarrollo puede plantearse a continuación un test de normalidad, en el

y obtenemos un test asintótico inmediato, que además nos proporciona un intervalo

Note que si λ1 → 0, la transformación de potencia se enfoca en un logaritmo.

Es deseable determinar un modelo relacionando el nivel de plasma para la edad de

Y: Columna numérica que contiene las n observaciones para la variable

7) Resumen del análisis

8) Gráfico del Modelo Estimado

La línea del mejor ajuste o ecuación de predicción, intervalos de confianza y límites

9) Gráfico de comparación CME

10) Gráfico de Sesgo y Curtosis

La estandarización del sesgo y la curtosis se presenta para ambas entre –2 y +2 para

es la familia de transformaciones de potencia de Box y Cox. La transformación

donde y es un vector de nx1 con las observaciones de la variable dependiente,

el error εi sea aditivo, homocedástico y con distribución simétrica. El

Defina un conjunto de valores para λ. Generalmente el valor de λ se

Bajo el supuesto de que la transformación λ simetriza la distribución de

Por tanto, el valor 𝜆̂ que minimiza a SA(λ) es la transformación de potencia

c. Obtención del error estándar de la transformación estimada