Está en la página 1de 25

“UNIVERSIDAD NACIONAL DE TRUJILLO”

FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS


ESCUELA PROFESIONAL DE ESTADÍSTICA

PRACTICAS 1 Y 2 – SEMANA 14

ANÁLISIS DE REGRESIÓN II

ALUMNOS

GARCIA ROSAS, Cinthia Verónica

ZAVALA VERA, Alejandro Enrique

ASESORES:

Lic. IPANAQUÉ CENTENO, Enrique

GRUPO:

N°03

TRUJILLO – PERÚ 2023


INGENIERÍA

TAREA 01 – SEMANA 14
Ejercicio 1:
¿Qué es y para qué sirve la transformación Box-Cox? ¿Qué expresión se usa?

Sol:

Las transformaciones Box-Cox se conocen como de Potencial, esta transformación


son una familia de transformaciones potenciales usadas en estadística para corregir
sesgos en la distribución de errores, para corregir varianzas desiguales (para
diferentes valores de la variable predictora) y principalmente para corregir la no
linealidad en la relación (mejorar correlación entre las variables). Esta
transformación recibe el nombre de los estadísticos George E. P. Box y David Cox.

Para transformar los datos, la fórmula de Box-Cox se escribe como:

Ejercicio 2:
Explique lo referente a la familia de transformaciones de Box-Cox e identifique la
correspondiente función de verosimilitud.

Sol:

La familia de transformaciones más utilizada para resolver los problemas de falta de


normalidad y de heterocedasticidad es la familia de Box-Cox, cuya definición es la
siguiente.

Se desea transformar la variable Y, cuyos valores muestrales se suponen positivos,


en caso contrario se suma una cantidad fija M tal que Y + M >0. La transformación
de Box-Cox depende de un parámetro por determinar y viene dada por:

Si se quieren transformar los datos para conseguir normalidad, el mejor método para
estimar el parámetro es el de máxima verosimilitud y se calcula como sigue: para
diferentes valores de se realiza la transformación:

2
INGENIERÍA

Siendo 𝑦̃ la media geométrica de la variable Y.


Para cada 
, se obtiene el conjunto de valores U i   n
i 1
La función de verosimilitud es:

Se elige el parámetro que maximiza L .

Ejercicio 3:
Explique lo relacionado al valor de lambda en la transformación de Box-Cox
correspondiente a los casos especiales.

Sol:

La transformación de Box-Cox estima un valor de lambda, como se muestra en la


siguiente tabla, que minimiza la desviación estándar de una variable transformada
estandarizada. La transformación resultante es Yλ cuando λ ҂ 0 y ln Y cuando λ = 0.

El método de Box-Cox busca entre muchos tipos de transformaciones. La siguiente


tabla muestra algunas transformaciones comunes donde Y' es la transformación de
los datos Y.

Transformación de potencia de Box-Cox (W = Y^λ)


Seleccione el valor de lambda (λ) que Minitab utiliza para transformar los datos.
Usar λ óptimo: Utilice el valor óptimo de lambda, que debe producir la
transformación con el mejor ajuste. Minitab redondea la lambda óptima a 0,5
o al entero más cercano.
Nota:
Para utilizar un valor exacto en lugar de un valor redondeado de λ óptima, elija
Archivo > Opciones > Gráficas de control y herramientas de calidad > Otros y
desmarque Usar valores redondeados para las transformaciones de Box-Cox
cuando sea posible.
λ = 0 (ln): Utilice el logaritmo natural de los datos.
λ = 0.5 (raíz cuadrada): Utilice la raíz cuadrada de los datos.

3
INGENIERÍA

Otro (ingrese un valor entre -5 y 5): Utilice un valor especificado para lambda.
Otras transformaciones comunes son el cuadrado (λ = 2), la raíz cuadrada
inversa (λ = −0,5) y la inversa (λ = −1). En la mayoría de los casos, no se debe
usar un valor fuera del rango de −2 y 2.

Ejercicio 4:
Explique los pasos a seguir en el uso de Box Cox con la aplicación del programa
“MINITAB”.

Sol:

Los pasos a seguir son los siguientes:

1) Se ingresan los datos en Minitab para verificar si se distribuyen normalmente.


2) Se obtiene el gráfico de histograma para ver si los datos de la variable “Nivel
de desperdicio” cumplen una Distribución Normal.
Ruta:
Grafica Histograma…
Histogramas: “Con ajuste” Aceptar
Variables de Graficas
Aceptar

Ruta: Pruebas de Normalidad:

Estadísticas - Estadísticas básicas - Prueba de normalidad…


Variable:

4
INGENIERÍA

Pruebas de normalidad: “Anderson Darling”; “Ryan Joiner”;


Aceptar
3) Si los datos insertados en el programa MINITAB no tienen una distribución
Normal: Se realiza la transformación de Box.
Ruta:
Estadísticas - Grafico de control - Transformación Box Cox…
Transformación Box Cox: Tamaños de los Subgrupos: 1
Aceptar
4) Se realiza la modificación de la variable Nueva Variable “New_ X”.
Ruta:
Calc - Calculadora…
Almacenar resultados en variable: X
Expresión: “ln (X)”
Aceptar
5) Con la variable Y modificada, es decir “X”
Repetimos el paso 2.
Y así obtenemos los siguientes resultados
Se obtiene el Histograma para ver si los datos tienen distribución
Normal y las pruebas de Normalidad.

6) Aplicando las Transformaciones BoxCox a la variable “X”, y se observa que se


asemeje a una distribución normal.
Corroborándolo con los test de normalidad ya que estos resultaron
mayores del 5% de alfa, es decir:

Ejercicio 6:
Explique los pasos a seguir en el uso de Box Cox con la aplicación del programa
STATGRAPHICS.

Sol:

El archivo plasma.sf3 contiene datos presentados por Neter et al. (1998) que
muestran el nivel de plasma de polaminos para n = 25 niños sanos. Una porción de
los datos se muestra abajo:

5
INGENIERÍA

Es deseable determinar un modelo relacionando el nivel de plasma para la edad de


los niños.
PASOS:
1) Entrada de datos
La caja de dialogo para la entrada de datos requiere los nombres de las columnas
que contienen la variable dependiente Y y la variable independiente X:

Y: Columna numérica que contiene las n observaciones para la variable


dependiente Y.
X: Columna numérica que contiene las n observaciones para la variable
independiente X.
Selección: Selección de un subconjunto de los datos.

2) Resumen del análisis

6
INGENIERÍA

3) Gráfico del Modelo Estimado

El grafico incluye:

La línea del mejor ajuste o ecuación de predicción, intervalos de confianza y límites


de predicción, en el caso de la ecuación de predicción se nota que se realiza un
trabajo relativamente bueno al tomar el incremento de la variabilidad del Nivel de
Plasma sobre Edades bajas, así como la relación de la curvatura. En los intervalos de
confianza estos son los límites interiores en el gráfico anterior y describen que tan
bien la localización de la línea fue estimada dada la muestra disponible de los datos.
Como el tamaño de n incrementa, estos límites llegarán a ser más apretados
También debemos notar que la anchura de los límites varia como una función de X,
con la línea estimada lo más exacto posible cerca del valor promedio y finalmente en
el límite de predicción estos son los límites externos del gráfico anterior y describen

7
INGENIERÍA

como exactamente uno podría predecir donde mentiría una nueva observación. Sin
importar el tamaño de muestra, las nuevas observaciones varían alrededor de la
verdadera línea.

4) Gráfico de comparación CME


Al optimizar la transformación, la potencia se reduce al mínimo sobre el cuadrado
medio del error del ajuste de W como una función de X. Para ilustrar el resultado de
la búsqueda, el Gráfico de Comparación CME presenta el cuadrado medio del error
en la vecindad del valor óptimo:

Las líneas verticales se dibujan en λ1 calculado y sus límites de confianza. Note que
el CME alcanza un mínimo cercano a λ1 = –0.5, aunque es relativamente plano con
una región amplia alrededor del valor óptimo, indicando que la potencia puede
cambiarse a otros valores sin afectar sustancialmente el modelo.

5) Gráfico de Sesgo y Curtosis


Este gráfico presenta los valores estandarizados del sesgo y la curtosis como una
función del parámetro de potencia λ1.

8
INGENIERÍA

La estandarización del sesgo y la curtosis se presenta para ambas entre –2 y +2 para


una transformación adecuada a los datos normalizados. El gráfico muestra una línea
horizontal entre –2 y +2, con la línea vertical indicando el valor óptimo de λ1 y sus
límites de confianza. Claramente, hay un amplio rango de valores para λ1 que crearía
una transformación razonable de los datos.

Ejercicio 7:
Ver el link y explique lo referente a la transformación de Box-Cox: La transformación
de box-cox. mayo 2014

Sol:

LA TRANSFORMACIÓN BOX-COX
Para la serie original X de longitud N

La transformación Box-Cox de un parámetro es la siguiente:

Donde

Como puede ver, esta transformación solo tiene un parámetro lambda. Si el valor de
lambda es igual a cero, se lleva a cabo la transformación logarítmica de la serie inicial,
y si dicho valor es distinto a cero la transformación es potencial. Si el parámetro
lambda es igual a uno, la ley de distribución de la serie inicial permanece sin cambios,
aunque la serie cambia, ya que se resta una unidad a cada uno de sus valores.

En función del valor de lambda, la transformación de Box-Cox incluye los siguientes


casos especiales:

9
INGENIERÍA

La utilización de la transformación Box-Cox requiere que todos los valores de la serie


de entrada sean positivos y distintos a cero. Si la serie de entrada no satisface estos
requisitos puede ser desplazada al área positiva por el volumen que garantiza un
valor "positivo" de todos sus valores.
De hecho, no es necesario aplicar este desplazamiento a las series "positivas". No
obstante, usaremos el mismo algoritmo para disminuir la probabilidad de obtener
valores demasiado altos al elevar a una potencia durante la transformación. De esta
forma, cualquier serie de entrada se situará en el área positiva después del cambio
y tendrá el valor más bajo cercano a cero.
La Figura 1 muestra las curvas de la transformación de Box-Cox con valores distintos
del parámetro lambda. La Figura 1 se ha obtenido del artículo. La cuadrícula
horizontal en el gráfico se muestra en una escala logarítmica.

Como vemos, las "colas" de la distribución inicial pueden "estirarse" o "contraerse".


La curva superior de la Figura 1 se corresponde con lambda = 3, mientras que la
inferior lo hace con lambda = -2.

Para que la ley de distribución de la serie resultante sea tan cercana a la distribución
normal como sea posible, debe seleccionarse el valor óptimo del parámetro lambda.

TRANSFORMACIÓN EN UNA LEY DE DISTRIBUCIÓN NORMAL

Una de las tareas más importantes de la transformación Box-Cox es la reducción de


la ley de distribución de la serie de entrada a una forma "normal".
Para evitar cualquier distracción y repetición innecesaria usaremos el algoritmo de
búsqueda del mínimo de la función por el método de Powell.
Si obtenemos valores de lambda demasiado grandes o demasiado pequeños durante
la optimización, esto puede indicar que la serie es de poca utilidad para el tipo de

10
INGENIERÍA

transformación seleccionada. Por tanto, sería una buena idea en cualquier caso no
excederse de un rango razonable a la hora de calcular el valor lambda.

SERIES ALEATORIAS
Se usa una serie pseudoaleatoria con una ley de distribución exponencial como datos
transformados.
Se utiliza la clase RNDXor128 para la generación de una serie pseudoaleatoria.
Luego se crea la serie de entrada, se desplaza al área de los valores positivos y se
lleva a cabo la búsqueda del valor óptimo del parámetro lambda.
Al escribir este artículo se seleccionó el tipo de análisis descrito en el artículo
"Análisis de las principales características de las series de tiempo" [6] para la
evaluación de los resultados de la transformación. A continuación, solo se muestran
los resultados gráficos del análisis realizado.

La Figura 2 muestra el histograma y el gráfico proporcionados por la escala de


distribución normal para la serie seudoaleatoria con una ley de distribución
exponencial. La prueba de Jarque-Bera da como resultado p=0,000. Como podemos
ver, la serie de entrada no es normal en absoluto y, tal y como era de esperar, su
distribución es similar a la exponencial.

La Figura 3 muestra el resultado del análisis de la serie transformada (script


BoxCoxTest1.mq5, matriz bcdat[]). La ley de distribución de la serie transformada
está mucho más cerca de la norma, lo que también se confirma a partir los resultados

11
INGENIERÍA

de la prueba de Jarque-Bera JB=4.73, р=0.094. El valor del parámetro lambda


obtenido es 0,2779.

Ejercicio 8:
Ver el link y explique el contenido de las pág. 34-38: Contraste de la normalidad
basado en la transformación Box-Cox. Peña

Sol:

Deducción del contraste de normalidad

Dada una variable aleatoria, y, Box y Cox han propuesto la familia de


transformaciones:

donde λ y m son parámetros a estimar. La familia es continua en λ y ha sido


extensamente utilizada para obtener homocedasticidad, linealidad y normalidad en
modelos estadísticos.
En este trabajo supondremos que y es un vector de variables aleatorias con
componentes:

donde yi(λ) viene dado por (2.1). La función soporte de las observaciones será:
Podemos simplificar la función soporte haciendo el Jacobiano de transformación
independiente de λ. Si en lugar de (2.1) tomamos:

Donde:

12
INGENIERÍA

es la media geométrica de las observaciones, la función soporte se reduce a:

que concentrada con respecto a σ2 y μ' queda finalmente:

donde Z(λ) es la media aritmética de los valores transformados Zi(λ).


El máximo de esta función será:

Donde:

Siendo:

Por tanto, el máximo de L(λ) se produce cuando la covarianza entre las variables ei(λ)
y xi(λ) es cero y el valor de la derivada (2.6) es precisamente la estimación del
coeficiente de regresión entre las variables ei(λ) y xi(λ).
La estimación óptima de λ puede llevarse a la práctica fácilmente utilizando un
algoritmo tipo Gauss-Newton, de acuerdo con el esquema iterativo:

Con este desarrollo puede plantearse a continuación un test de normalidad, en el


cual la hipótesis nula será λ0 = 1.0. Supongamos que mediante iteraciones tipo (2,9)
se ha obtenido λ1 como valor maximoverosímil de λ.
El test de razón de verosimilitud de la hipótesis nula de datos gaussianos, está
definido por la región crítica:

13
INGENIERÍA

Que es equivalente a:

y obtenemos un test asintótico inmediato, que además nos proporciona un intervalo


de confianza aproximado para el valor estimado λ1.

Ejercicio 9:
Ver el link y explique el contenido: Transformaciones de Box-Cox STATGRAPHICS –
Rev. 9/14/2006
Sol:

Transformación de Box-Cox
Es diseñado para determinar una transformación óptima para Y mientras se estima
un modelo de regresión lineal. Es muy útil cuando la variabilidad de Y cambia como
una función de X. A menudo, una apropiada transformación de Y estabiliza la
variabilidad y produce que las desviaciones alrededor del modelo sean más
normalmente distribuidas.
La clase de transformaciones consideradas son transformaciones de potencia
definidas por:

en la cual los datos son calculados en una potencia de λ1 después de cambiarlo a una
cierta cantidad λ2. Posteriormente, el parámetro de cambio λ2 se fija igual a 0. Esta
clase incluyen raíces cuadradas, logaritmos, recíprocos, y otras transformaciones
comunes, que dependen sobre una potencia. Los ejemplos incluyen:

14
INGENIERÍA

Note que si λ1 → 0, la transformación de potencia se enfoca en un logaritmo.


Ejemplo:
El archivo plasma.sf3 contiene datos presentados por Neter et al. (1998) que
muestran el nivel de plasma de polaminos para n = 25 niños sanos. Una porción de
los datos se muestra abajo:

Es deseable determinar un modelo relacionando el nivel de plasma para la edad de


los niños.
PASOS:
6) Entrada de datos
La caja de dialogo para la entrada de datos requiere los nombres de las columnas
que contienen la variable dependiente Y y la variable independiente X:

Y: Columna numérica que contiene las n observaciones para la variable


dependiente Y.
X: Columna numérica que contiene las n observaciones para la variable
independiente X.
Selección: Selección de un subconjunto de los datos.

15
INGENIERÍA

7) Resumen del análisis

8) Gráfico del Modelo Estimado

El grafico incluye:

La línea del mejor ajuste o ecuación de predicción, intervalos de confianza y límites


de predicción, en el caso de la ecuación de predicción se nota que se realiza un
trabajo relativamente bueno al tomar el incremento de la variabilidad del Nivel de
Plasma sobre Edades bajas, así como la relación de la curvatura. En los intervalos de
confianza estos son los límites interiores en el gráfico anterior y describen que tan
bien la localización de la línea fue estimada dada la muestra disponible de los datos.
Como el tamaño de n incrementa, estos límites llegarán a ser más apretados
También debemos notar que la anchura de los límites varia como una función de X,
con la línea estimada lo más exacto posible cerca del valor promedio y finalmente en

16
INGENIERÍA

el límite de predicción estos son los límites externos del gráfico anterior y describen
como exactamente uno podría predecir donde mentiría una nueva observación. Sin
importar el tamaño de muestra, las nuevas observaciones varían alrededor de la
verdadera línea.

9) Gráfico de comparación CME


Al optimizar la transformación, la potencia se reduce al mínimo sobre el cuadrado
medio del error del ajuste de W como una función de X. Para ilustrar el resultado de
la búsqueda, el Gráfico de Comparación CME presenta el cuadrado medio del error
en la vecindad del valor óptimo:

Las líneas verticales se dibujan en λ1 calculado y sus límites de confianza. Note que
el CME alcanza un mínimo cercano a λ1 = –0.5, aunque es relativamente plano con
una región amplia alrededor del valor óptimo, indicando que la potencia puede
cambiarse a otros valores sin afectar sustancialmente el modelo.

10) Gráfico de Sesgo y Curtosis


Este gráfico presenta los valores estandarizados del sesgo y la curtosis como una
función del parámetro de potencia λ1.

17
INGENIERÍA

La estandarización del sesgo y la curtosis se presenta para ambas entre –2 y +2 para


una transformación adecuada a los datos normalizados. El gráfico muestra una línea
horizontal entre –2 y +2, con la línea vertical indicando el valor óptimo de λ1 y sus
límites de confianza. Claramente, hay un amplio rango de valores para λ1 que crearía
una transformación razonable de los datos.

Ejercicio 10:
Ver el link y explique el contenido: Una estimación no paramétrica y robusta de la
transformación Box-Cox para el modelo de regresión

Sol:

INTRODUCCIÓN:
El análisis de regresión lineal clásico se basa en los supuestos de que el término de
error es aditivo, sigue una distribución normal y tiene varianza constante. Cuando
estas hipótesis son seriamente violadas, se sugieren diferentes alternativas a seguir:
Ignorar la violación de los supuestos y proceder como si fueran válidos.
Analizar cuál es el supuesto adecuado y usar un procedimiento válido que lo
tenga en cuenta.
Diseñar un nuevo modelo que tenga las características importantes del
modelo original y satisfaga todos los supuestos, por medio de la aplicación de
una transformación adecuada a los datos o filtrado algunos datos que
parecen sospechosos de ser atípicos.
Usar un procedimiento a distribución libre que sea válido aun cuando varios
supuestos son violados.
La opción iii) es frecuentemente el camino elegido por muchos investigadores y
generalmente la transformación de Box y Cox es utilizada con el objetivo de que los
supuestos de aditividad, normalidad y varianza constante sean satisfechos
aproximadamente. Sin embargo, dicho procedimiento no es robusto y puede verse
afectado ante la existencia de observaciones atípicas en los datos. En esta situación,
autores proponen estimadores robustos para el parámetro de transformación,
reemplazando la verosimilitud normal con una función objetivo que es menos
sensible a las observaciones atípicas. Este artículo presenta un procedimiento
alternativo no paramétrico y robusto que permite obtener la transformación de
potencia en la familia de transformaciones de Box y Cox cuando existen
observaciones atípicas en la variable dependiente. El procedimiento es una
extensión de la propuesta de Castaño (1994, 1995) de una transformación de
simetría para un conjunto de datos.

18
INGENIERÍA

METODOLOGÍA
a. El procedimiento de Box y Cox
La transformación de Box y Cox trata de estimar el parámetro λ de una
transformación potencial sobre la variable dependiente del modelo de
regresión lineal:

Donde:

es la familia de transformaciones de potencia de Box y Cox. La transformación


estimada se obtiene por medio de la maximización de la verosimilitud normal.

donde y es un vector de nx1 con las observaciones de la variable dependiente,


y(λ) es un vector de nx1 con las observaciones de la variable dependiente
transformadas por el parámetro λ, X es la matriz de nx(k+1) de diseño del
modelo de regresión lineal, β es el vector de (k+1)x1 que contiene los
parámetros del modelo, σ2 es la varianza del término de error del modelo y
J(λ,y) = ∏𝑛𝑖=1 𝑦𝑖𝜆−1 es el Jacobiano de la transformación de Box y Cox.
Aunque la transformación estimada posee las propiedades de los
estimadores máximos verosímiles, no es robusta a la presencia de
observaciones atípicas en la variable dependiente.

b. El procedimiento propuesto
El procedimiento que se propone trata de obtener una transformación λ en
la familia de transformaciones de potencia de Box y Cox de forma tal que en
el modelo:

el error εi sea aditivo, homocedástico y con distribución simétrica. El


procedimiento de búsqueda del estimador de λ consta de las siguientes
etapas:

19
INGENIERÍA

Defina un conjunto de valores para λ. Generalmente el valor de λ se


encuentra en el intervalo [-2, 2]. Para cada valor de λ elegido, estime
el modelo (1) usando regresión LAD y calcule los residuales ei(λ).
Obtenga los residuales normalizados como ein(λ)=ei(λ) / MAD(ei(λ)),
donde MAD = mediana{| ei(λ) − mediana{ ei(λ) } |}. Este procedimiento
elimina las diferentes unidades de medida en la función objetivo,
introducidas al ir cambiando λ.
Calcule los percentiles muestrales p ξp(λ) y ξp-1(λ) de los ein(λ) para
varios valores de p, 0<p<1. Obtenga

Y defina la función:

Bajo el supuesto de que la transformación λ simetriza la distribución de


los errores,

Por tanto, el valor 𝜆̂ que minimiza a SA(λ) es la transformación de potencia


en la familia de transformaciones de Box-Cox que simetriza la distribución
de los errores. Para el caso de una muestra aleatoria, Castaño (1995)
muestra 𝜆̂ es un estimador consistente.

c. Obtención del error estándar de la transformación estimada


Para el cálculo del error estándar se emplea la técnica del Bootstrap (ver, por
ejemplo, Efron y Tibshirani, 1986). El procedimiento es el siguiente:
Obtenga la transformación 𝜆̂ y calcule los residuales ei, i=1, 2, …, n, de
la regresión estimada:

Obtenga una muestra aleatoria de tamaño n usando muestreo


reemplazamiento de los residuales 𝑒𝑖 . Sean 𝑒𝑖∗ los residuales
obtenidos. Construya los pseudos datos para la variable dependiente
𝑦𝑖 como:

20
INGENIERÍA

Use el procedimiento descrito para estimar λ en el modelo con los


pseudo datos:

EXPERIMENTO DE MONTECARLOS
En este apartado nos dicen que se hicieron 100, 250 y 1000 observaciones para la
estimación de lambda (λ) habiendo o no observaciones atípicas.
En el caso 1. Era sobre que no había observaciones atípicas. Y se
generaron observaciones al azar para el modelo.

En el caso 2. Hay observaciones atípicas. Se generaron observaciones


para el mismo modelo anterior, pero en el término de error se
generaron 5 observaciones atípicas usando la distribución N(0,25) .

Y se obtuvieron resultados que presentas los resultados de la estimación de lambda


(λ) por medio de transformación Box y Cox, usando regresión robusta (LAD) y usando
el método propuesto (que busca que el error sea aditivo, homocedástico y con
distribución simétrica.

21
INGENIERÍA

Para los experimentos realizados, los resultados muestran que cuando existen
observaciones atípicas, en general, el método propuesto es más preciso y produce
menos sesgos que el método de Box y Cox y que la búsqueda directa por medio de
la regresión robusta LAD. También se observa que a medida que el tamaño muestral
crece, los sesgos decrecen y estimador propuesto converge al parámetro
desconocido, exhibiendo la propiedad de consistencia del nuevo estimador para λ.
En muestras pequeñas, el procedimiento LAD tiene un comportamiento un poco más
malo que el de Box y Cox, aunque es mejor a medida que el tamaño muestral crece.
CONCLUSIONES
Para los casos estudiados se pueden extraer las siguientes conclusiones.
El procedimiento de Box-Cox es sensible a la presencia de observaciones
atípicas en la variable respuesta. El procedimiento propuesto proporciona
un estimador más eficiente que el procedimiento de Box-Cox y que el de la
búsqueda directa empleando la regresión LAD.
Cuando no existen observaciones atípicas, como era de esperar, es más
eficiente el procedimiento de Box-Cox, seguido de lejos por la búsqueda
directa usando regresión LAD.
Para muestras pequeñas la regresión LAD y el procedimiento de Box- Cox
obtienen resultados similares, con una ligera ventaja de Box-Cox. Sin
embargo, a medida que el tamaño muestral crece, la regresión LAD presenta
mejor comportamiento que el procedimiento de Box-Cox.
El nuevo procedimiento disminuye sesgos y aumenta precisión a medida
que el tamaño muestral crece.

22
INGENIERÍA

La nueva transformación parece ser útil en muestras moderadas y grandes.

Ejercicio 11:
Ver el link y explique el contenido: pág. 30-32. Análisis de la metodología Box-Cox
para medir la resistividad del terreno
Sol:
METODOLOGIA TRANSFORMACIÓN DE BOX COX
Para calcular el valor de la resistividad del terreno necesario para el diseño de un
sistema de puesta a tierra existen métodos donde se supone que el terreno es de
una sola capa o de n capas. Se considera que el modelamiento del suelo como
homogéneo es adecuado cuando los diversos valores medidos no se apartan en más
de un 30% del valor máximo. Cuando se aplica el método unicapa, se asume que el
terreno es homogéneo es por tanto que se requiere un único valor de resistividad,
en este caso la metodología box Cox es aplicable porque permite calcular un solo
valor de resistividad con una probabilidad del 70%.

CÁLCULO DEL VALOR APROXIMADO PARA LA RESISTIVIDAD


Para el cálculo de este parámetro se emplea el método probabilístico
(transformación de Box Cox), para lo cual se tomará una probabilidad del 70% como
aceptable para la asignación de la resistividad a partir del ajuste de distribución
normal.
Partiendo de los datos de resistividad obtenidos de las lecturas, aplica el siguiente
procedimiento:
Se halla el promedio de la resistividad aparente 𝑥𝑝.
Se tabulan los datos de resistividad aparente medida 𝜌𝑖.
En una columna se colocan los logaritmos naturales de cada una de las
medidas.

Se halla la resistividad promedio 𝑥̅ como:

En otra columna se coloca el resultado de (𝑥𝑖−𝑥̅)2


Se calcula la desviación estándar S como:

23
INGENIERÍA

De la distribución normal se toma Z para 70% de 0.524400513


Se halla la resistividad (con probabilidad del 70% de no ser superada) por la
siguiente fórmula:

Ejemplo 2: Aplicación de la metodología Box-Cox a los valores del Ejemplo 1.


Tabla 3. Calculo del valor de la resistividad para el punto 3 con los valores promedio
a una misma separación de electrodos.

Nota: Este cálculo se realizó con los valores promedios a una misma separación de
los electrodos.
Tabla 4: Cálculo del valor de la resistividad para el punto 3 con todos los valores
obtenidos en el método de Wenner.

24
INGENIERÍA

Nota: Todos los valores obtenidos con el Método de Wenner se usan como conjunto
de datos para estimar el valor de resistividad utilizando de la metodología
Transformación Box-Cox.

25

También podría gustarte