Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Transformacion de Variables
Transformacion de Variables
Introduccin
La tipificacin de variables resulta muy til para eliminar su dependencia respecto a
las unidades de medida empleadas. En realidad, una tipificacin equivale a una transformacin lineal
Z=
siendo Z = aX + b donde a =
X x
x
1
= X
y b = x .
Transformaciones no lineales
Supongamos que se trata de estudiar el crecimiento del consumo de energa en diferentes pases.
Una opcin consiste en en estudiar las diferencias de consumo entre dos instantes
de tiempos Ct Ct1 , pero en general resulta ms conveniente considerar las diferencias
Ct Ct1
Ct
Ct Ct1
ln Ct ln Ct1 = ln
= ln 1 +
Ct1
Ct1
Ct1
Ct
Ct1
Ct1
de modo que las diferencias de las variables transformadas por un logaritmo, son una
medida promedio de las dos formas posibles de medir el crecimiento relativo.
Como regla general, se trata de escoger una transformacin que conduzca a una distribucin simtrica, y ms cercana a la distribucin normal. De este modo, se pueden
aplicar numerosas tcnicas de inferencia estadstica.
En una distribucin simtrica unimodal, la media, moda y mediana coinciden; adems,
el coeficiente de asimetra es cero (as como todos los momentos de orden impar).
Transformaciones no lineales ms frecuentes
Cuando se tienen distribuciones de frecuencias con asimetra negativa (frecuencias
altas hacia el lado derecho de la distribucin), es conveniente aplicar la transformacin
y = x2 . Esta transformacin comprime la escala para valores pequeos y la expande para
valores altos.
Para distribuciones asimtricas positivas se usan las transformaciones
x, ln(x) y 1/x,
que comprimen los valores altos y expanden los pequeos. El efecto de estas transforma
ciones est en orden creciente: menos efecto x, ms ln(x) y ms an 1/x.
X =(2.2, 7.6, 2.9, 4.6, 4.1, 3.9, 7.4, 3.2, 5.1, 5.3, 20.1, 2.3, 5.5, 32.7, 9.1, 1.7, 3.2, 5.8,
16.3, 15.9, 5.9, 6.7, 3.4, 40.5).
Si se dibuja el histograma, se observa que la distribucin es muy asimtrica: la mayor
parte de los pases tienen un incremento menor que 10 y unos pocos un incremento mucho
mayor. Si se toma la transformacin logaritmo, se obtiene una distribucin simtrica de
los datos.
6
4
0
frecuencias
10
Histograma de la variable x
10
20
30
40
4
0
frecuencias
ln(x)
Respectivamente, si se dibuja el diagrama de cajas, se obtienen numerosos datos atpicos con los datos originales. Si se considera la transformacin logaritmo, los atpicos desaparecen.
ln(x)
0.5
1.0
10
1.5
2.0
20
2.5
30
3.0
3.5
40