Transformaciones de Potencia

STATGRAPHICS – Rev.
9/14/2006
Transformaciones de Potencia
Resumen
El procedimiento Transformaciones de Potencia está diseñado para definir una transformación
normalizadora para una columna de observaciones numéricas que no provienen de una
distribución normal. En tales casos, frecuentemente es posible encontrar una transformación de
potencia que hará a los datos aproximadamente normales. Dada tal transformación, pueden
entonces aplicarse procedimientos estadísticos a los datos transformados que asumen
normalidad.
El procedimiento usa el método propuesto por by Box y Cox (1964).
StatFolio de Ejemplo: powertransforms.sgp
Datos de Ejemplo:
El archivo groundwater.sf3 contiene n = 47 medidas de la concentración de uranio en muestras
de agua del suelo tomadas de una localidad en el noroeste de Texas. La tabla a continuación
muestra una lista parcial de los datos de ese archivo:
ppm
8.25
2.82
4.16
18.66
12.72
8.75
2.29
7.22
9.76
7.72
27.38
5.14
La concentración es medida en partes por millón (ppm).
© 2006 por StatPoint, Inc. Transformaciones de Potencia - 1

STATGRAPHICS – Rev. 9/14/2006
Ingreso de Datos
Los datos a analizar consisten de una sola columna numérica que contiene n = 2 o más
observaciones.
• Datos: columna numérica que contiene los dato a ser analizados.
• Seleccionar: selección de un subgrupo de datos.
Resumen del Análisis

El Resumen del Análisis muestra las transformaciones derivadas para los datos.
Transformaciones de Potencia - ppm

Datos/Variable: ppm
Número de observaciones = 47
Transformación Box-Cox
Potencia (lambda1): 0.204
Cambio (lambda2): 0.0
(optimizar)
Media geométrica = 9.01355
Intervalo aproximado del 95% de confianza para la potencia: -0.077 a 0.505
El procedimiento determina automáticamente la mejor transformación de potencia encontrando

el valor de λ1 que minimiza la desviación estándar de las observaciones cuando son
transformadas de acuerdo con la transformación de Box-Cox:
( X + λ 2 ) λ1 − 1
Y = 1+ si λ1 ≠ 0 (1)
λ1 g λ1 −1
Y = 1 + g ln( X + λ 2 ) si λ1 = 0 (2)
donde g es la media geométrica de las observaciones después de agregarles λ2:

1/ n
⎛ n ⎞
g = ⎜⎜ ∏ ( X i + λ 2 ) ⎟⎟ (3)
⎝ i =1 ⎠
El parámetro λ2 se establece como 0 a menos que el analista especifique un valor diferente de

cero en la caja de diálogo de las Opciones de Análisis.
En el corazón de las transformaciones anteriores está la potencia a la cual se elevarán los datos,
λ1. Frecuentemente, una potencia entre –2 y +2 hará a los datos aproximadamente normales. Esto
incluye muchas transformaciones comunes:
Potencia λ1 Transformación
-2.0 cuadrada recíproca
-1.0 recíproca
-0.5 raíz cuadrada recíproca
-0.3333 raíz cúbica recíproca
0 logaritmo
0.3333 raíz cúbica
0.5 raíz cuadrada
1.0 ninguna
2.0 cuadrada
En general, entre más se aleje λ1 de 1.0, más fuerte es la transformación. Se requieren potencias
menores que 1.0 para normalizar datos sesgados positivamente, mientras que para datos sesgados
negativamente se requieren potencias mayores que1.0.
La siguiente es información importante que se incluye en la salida:
1. Potencia (λ1): la potencia óptima para los datos. Para los datos de muestra, parece que
ppm0.204 es la transformación óptima para alcanzar la normalidad.
2. Traslado (λ2): una constante especificada por el usuario que se agrega a cada
observación antes de elevarla a una potencia. En algunos casos, trasladar los datos antes
de realizar la transformación de potencia mejora el ajuste.
3. Media geométrica (g): la media geométrica de las observaciones después de agregar el

parámetro de traslado.
4. Intervalo de confianza aproximado para la potencia: un intervalo de confianza

aproximado para el parámetro de la potencia λ1. Ya que la transformación de potencia
obtenida se basa en una muestra de datos, es sólo un estimador puntual de la mejor
potencia para la población de la cual se tomaron los datos. El intervalo de confianza
muestra el margen estimado de error. En este caso, cualquier potencia entre –0.077 y
0.505 podría ser un valor razonable para λ1. Esto incluye una transformación logarítmica
y una raíz cuadrada.

Opciones de Análisis
• Potencia (lambda1): el parámetro de potencia λ1. Si se marca Optimizar, este valor será
determinado automáticamente por el procedimiento.
• Traslado (lambda2): el parámetro de traslado λ2. Este valor se agrega a las observaciones
antes de realizar la transformación de potencia.
• Optimizar: marque esta casilla para hacer que el procedimiento determine un valor óptimo
para λ1 usando el método de Box-Cox.
Gráfico de Probabilidad Normal

Esta ventana exhibe el gráfico de probabilidad para los valores transformados.
Gráfica Probabilística Normal para transformados ppm

lambda1 = 0.204, lambda2 = 0.0
99.9
99
95
porcentaje
80
50
20
5
1
0.1
-1 9 19 29 39
transformados ppm
Si la transformación fue exitosa en cuanto a normalizar los datos, éstos deben estar
aproximadamente a lo largo de una línea recta. Para los datos muestra, la transformación fue
muy efectiva.

Se pueden encontrar detalles con respecto al gráfico de probabilidad normal en la documentación
del Gráfico de Probabilidad Normal.
Opciones de Ventana
• Dirección: la orientación del gráfico. Si es Vertical, el Porcentaje se presenta en el eje

vertical. Si es Horizontal, el Porcentaje se presenta en el eje horizontal.
• Línea Ajustada: el método usado para ajustar la línea de referencia a los datos. Si es Usando
Cuartiles, la línea pasa por la mediana cuando el Porcentaje es de 50 con una pendiente
determinada a partir del rango intercuartílico. Si es Usando Mínimos Cuadrados, la línea se
ajusta con la regresión por mínimos cuadrados de los cuantiles normales de las estadísticas de
orden. El primer método basado en los cuartiles da más peso a la forma de los datos cerca del
centro y frecuentemente permite mostrar desviaciones de la normalidad en las colas que no
serían evidentes usando el método de mínimos cuadrados.

Tabla de Comparación del CME

El procedimiento de Box-Cox encuentra el valor λ1 que minimiza el cuadrado medio del error
∑ (Y −Y )
n
2
i
i =1
CME = (4)
n
Esta tabla muestra los CME para varios valores de λ1.
Tabla comparativa MSE

lambda1 MSE
-2.0 10323.0
-1.8 4809.42
-1.6 2311.36
-1.4 1154.69
-1.2 605.55
-1.0 337.376
-0.8 202.379
-0.6 132.407
-0.4 95.3914
-0.2 75.9491
0.0 66.6195
0.2 63.853
0.4 66.1757
0.6 73.3865
0.8 86.2915
1.0 106.778
1.2 138.193
1.4 186.112
1.6 259.687
1.8 373.974
2.0 553.922
Opciones de Ventana
• Lambda1 Máxima: mínimo valor de λ1 a presentar en la tabla.

• Lambda1 Mínima: máximo valor de λ1 a presentar en la tabla.
• Resolución: el número de incrementos entre los valores máximo y mínimo.

Gráfico de Comparación del CME
Este gráfico muestra el CME como una función de λ1.
Comparación MSE
lambda2 =0.0
113
103
93
MSE
83
73
63
-0.5 -0.2 0.1 0.4 0.7 1
lambda1
Se dibujan líneas verticales en el valor de λ1 obtenido y en sus límites de confianza.
Opciones de Ventana
• Lambda1 Máxima: mínimo valor de λ1 a presentar en el gráfico.

• Lambda1 Mínima: máximo valor de λ1 a presentar en el gráfico.
• Resolución: el número de valores de λ1 en los cuales se graficará el CME.
Pruebas de Normalidad
Esta ventana muestra los resultados de varias pruebas para determinar si una distribución normal
modela adecuadamente los datos transformados.
Pruebas de Normalidad
Potencia (lambda1): 0.204
Prueba Estadístico Valor-P

Chi-Cuadrado 9.29787 0.861435
Estadístico W de Shapiro-Wilk 0.981806 0.8057
Puntuación Z para asimetría -0.0732864 0.941573
Puntuación Z para curtosis -0.697379 0.485563

Valores de P pequeños para cualquier prueba (menor de 0.05 si se trabaja con un nivel de
significancia del 5%) conducen al rechazo de la hipótesis de que los datos transformados siguen
una distribución normal. Para los datos de muestra, la transformación parece haber normalizado
los datos adecuadamente.
Para más detalles sobre pruebas de normalidad, refiérase a la documentación en Ajuste de

Distribuciones (Datos No Censurados).
Opciones de Ventana
• Incluir: elija una o más pruebas a realizarse.
Gráfico de Sesgo y Curtosis

Este gráfico muestra los valores del sesgo y de la curtosis estandarizados como una función del
parámetro de potencia λ1.
Gráfica de Sesgo y Curtosis

lambda2 =0.0
3
sesgo
2 curtosis
-1
-2
-3
-0.5 -0.2 0.1 0.4 0.7 1
lambda1
El sesgo y la curtosis estandarizados deben estar ambos entre –2 y +2 para una transformación
que normalice los datos adecuadamente. El gráfico muestra líneas horizontales en –2 y +2, con
las líneas verticales indicando el valor óptimo de λ1 y sus límites de confianza.

Claramente, hay un rango amplio de valores de λ1 que harían una buena transformación de los
datos.
Opciones de Ventana
• Lambda1 Máxima: mínimo valor de λ1 a presentar en el gráfico.

• Lambda1 Mínima: máximo valor de λ1 a presentar en el gráfico.
• Resolución: el número de valores de λ1 en los cuales se graficarán las estadísticas.
Salvara Resultados
Se pueden salvar los valores de los Datos Transformados Y a una columna de la hoja de datos.
Cálculos
Sesgo Estandarizado & Curtosis Estandarizada
Calculados usando el método descrito bajo Pruebas de Normalidad en la documentación para

Ajuste de Distribuciones (Datos No Censurados).

Transformaciones de Potencia

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Transformaciones de Potencia

Cargado por

Copyright:

Formatos disponibles

STATGRAPHICS – Rev.

El procedimiento usa el método propuesto por by Box y Cox (1964).

StatFolio de Ejemplo: powertransforms.sgp

La concentración es medida en partes por millón (ppm).

© 2006 por StatPoint, Inc. Transformaciones de Potencia - 1

• Datos: columna numérica que contiene los dato a ser analizados.

• Seleccionar: selección de un subgrupo de datos.

Resumen del Análisis

Transformaciones de Potencia - ppm

Media geométrica = 9.01355

Intervalo aproximado del 95% de confianza para la potencia: -0.077 a 0.505

El procedimiento determina automáticamente la mejor transformación de potencia encontrando

donde g es la media geométrica de las observaciones después de agregarles λ2:

© 2006 por StatPoint, Inc. Transformaciones de Potencia - 2

El parámetro λ2 se establece como 0 a menos que el analista especifique un valor diferente de

La siguiente es información importante que se incluye en la salida:

3. Media geométrica (g): la media geométrica de las observaciones después de agregar el

4. Intervalo de confianza aproximado para la potencia: un intervalo de confianza

© 2006 por StatPoint, Inc. Transformaciones de Potencia - 3

Gráfico de Probabilidad Normal

Gráfica Probabilística Normal para transformados ppm

© 2006 por StatPoint, Inc. Transformaciones de Potencia - 4

• Dirección: la orientación del gráfico. Si es Vertical, el Porcentaje se presenta en el eje

© 2006 por StatPoint, Inc. Transformaciones de Potencia - 5

Tabla de Comparación del CME

Esta tabla muestra los CME para varios valores de λ1.

Tabla comparativa MSE

• Lambda1 Máxima: mínimo valor de λ1 a presentar en la tabla.

© 2006 por StatPoint, Inc. Transformaciones de Potencia - 6

• Lambda1 Máxima: mínimo valor de λ1 a presentar en el gráfico.

Prueba Estadístico Valor-P

© 2006 por StatPoint, Inc. Transformaciones de Potencia - 7

Para más detalles sobre pruebas de normalidad, refiérase a la documentación en Ajuste de

• Incluir: elija una o más pruebas a realizarse.

Gráfico de Sesgo y Curtosis

Gráfica de Sesgo y Curtosis

© 2006 por StatPoint, Inc. Transformaciones de Potencia - 8

• Lambda1 Máxima: mínimo valor de λ1 a presentar en el gráfico.

Sesgo Estandarizado & Curtosis Estandarizada

Calculados usando el método descrito bajo Pruebas de Normalidad en la documentación para

© 2006 por StatPoint, Inc. Transformaciones de Potencia - 9

También podría gustarte