Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Transformaciones de Potencia
Transformaciones de Potencia
9/14/2006
Transformaciones de Potencia
Resumen
El procedimiento Transformaciones de Potencia está diseñado para definir una transformación
normalizadora para una columna de observaciones numéricas que no provienen de una
distribución normal. En tales casos, frecuentemente es posible encontrar una transformación de
potencia que hará a los datos aproximadamente normales. Dada tal transformación, pueden
entonces aplicarse procedimientos estadísticos a los datos transformados que asumen
normalidad.
Datos de Ejemplo:
El archivo groundwater.sf3 contiene n = 47 medidas de la concentración de uranio en muestras
de agua del suelo tomadas de una localidad en el noroeste de Texas. La tabla a continuación
muestra una lista parcial de los datos de ese archivo:
ppm
8.25
2.82
4.16
18.66
12.72
8.75
2.29
7.22
9.76
7.72
27.38
5.14
Transformación Box-Cox
Potencia (lambda1): 0.204
Cambio (lambda2): 0.0
(optimizar)
( X + λ 2 ) λ1 − 1
Y = 1+ si λ1 ≠ 0 (1)
λ1 g λ1 −1
Y = 1 + g ln( X + λ 2 ) si λ1 = 0 (2)
En el corazón de las transformaciones anteriores está la potencia a la cual se elevarán los datos,
λ1. Frecuentemente, una potencia entre –2 y +2 hará a los datos aproximadamente normales. Esto
incluye muchas transformaciones comunes:
Potencia λ1 Transformación
-2.0 cuadrada recíproca
-1.0 recíproca
-0.5 raíz cuadrada recíproca
-0.3333 raíz cúbica recíproca
0 logaritmo
0.3333 raíz cúbica
0.5 raíz cuadrada
1.0 ninguna
2.0 cuadrada
En general, entre más se aleje λ1 de 1.0, más fuerte es la transformación. Se requieren potencias
menores que 1.0 para normalizar datos sesgados positivamente, mientras que para datos sesgados
negativamente se requieren potencias mayores que1.0.
1. Potencia (λ1): la potencia óptima para los datos. Para los datos de muestra, parece que
ppm0.204 es la transformación óptima para alcanzar la normalidad.
2. Traslado (λ2): una constante especificada por el usuario que se agrega a cada
observación antes de elevarla a una potencia. En algunos casos, trasladar los datos antes
de realizar la transformación de potencia mejora el ajuste.
Opciones de Análisis
• Potencia (lambda1): el parámetro de potencia λ1. Si se marca Optimizar, este valor será
determinado automáticamente por el procedimiento.
• Traslado (lambda2): el parámetro de traslado λ2. Este valor se agrega a las observaciones
antes de realizar la transformación de potencia.
• Optimizar: marque esta casilla para hacer que el procedimiento determine un valor óptimo
para λ1 usando el método de Box-Cox.
80
50
20
5
1
0.1
-1 9 19 29 39
transformados ppm
Si la transformación fue exitosa en cuanto a normalizar los datos, éstos deben estar
aproximadamente a lo largo de una línea recta. Para los datos muestra, la transformación fue
muy efectiva.
Opciones de Ventana
• Línea Ajustada: el método usado para ajustar la línea de referencia a los datos. Si es Usando
Cuartiles, la línea pasa por la mediana cuando el Porcentaje es de 50 con una pendiente
determinada a partir del rango intercuartílico. Si es Usando Mínimos Cuadrados, la línea se
ajusta con la regresión por mínimos cuadrados de los cuantiles normales de las estadísticas de
orden. El primer método basado en los cuartiles da más peso a la forma de los datos cerca del
centro y frecuentemente permite mostrar desviaciones de la normalidad en las colas que no
serían evidentes usando el método de mínimos cuadrados.
∑ (Y −Y )
n
2
i
i =1
CME = (4)
n
Opciones de Ventana
Comparación MSE
lambda2 =0.0
113
103
93
MSE
83
73
63
-0.5 -0.2 0.1 0.4 0.7 1
lambda1
Se dibujan líneas verticales en el valor de λ1 obtenido y en sus límites de confianza.
Opciones de Ventana
Pruebas de Normalidad
Esta ventana muestra los resultados de varias pruebas para determinar si una distribución normal
modela adecuadamente los datos transformados.
Pruebas de Normalidad
Potencia (lambda1): 0.204
Cambio (lambda2): 0.0
Valores de P pequeños para cualquier prueba (menor de 0.05 si se trabaja con un nivel de
significancia del 5%) conducen al rechazo de la hipótesis de que los datos transformados siguen
una distribución normal. Para los datos de muestra, la transformación parece haber normalizado
los datos adecuadamente.
Opciones de Ventana
-1
-2
-3
-0.5 -0.2 0.1 0.4 0.7 1
lambda1
El sesgo y la curtosis estandarizados deben estar ambos entre –2 y +2 para una transformación
que normalice los datos adecuadamente. El gráfico muestra líneas horizontales en –2 y +2, con
las líneas verticales indicando el valor óptimo de λ1 y sus límites de confianza.
Opciones de Ventana
Salvara Resultados
Se pueden salvar los valores de los Datos Transformados Y a una columna de la hoja de datos.
Cálculos