Está en la página 1de 18

DATOS ATPICOS Y TRANSFORMACIONES

Cesar Castro Anderson Guerrero

DATOS ATPICOS

Datos que tienen un valor extremo con respecto al conjunto de datos en que se encuentran Generan malas interpretaciones o ruidos. Especial cuidado al detectarlos (sesgo de informacin)

Pueden detectarse por medio de diagramas de dispersin.

Grafica de pares de la base de datos Aves

TRANSFORMACIONES
Son tiles cuando se presentan valores extremos o atpicos. Cuando las distribuciones no son normales . Cuando no hay clara evidencia de heterogeneidad de datos. Su eleccin depende de la seleccin de los anlisis estadsticos y de la experiencia del investigador.

Verificar existen valores atpicos. Escoger el tipo de transformacin ms adecuada. En casos extremos omitir estos valores del anlisis pero siempre realizando los anlisis con y sin estos datos.

Transformaciones Box-cox

Se puede aplicar si los datos no son negativos. Se utilizan para corregir sesgos en: Distribucin. Varianzas desiguales. La no linealidad en la relacin

Ayuda a mejorar la correlacin entre las variables.

REGLA DE ABULTAMIENTO DE MOSTELLER Y TUKEY

Cuando el anlisis de seguimiento se basa en relaciones lineales y no se puedan identificar patrones.

se requiere un aumento o disminucin de los ejes x y y para para transformar los datos de forma lineal.

pasos ara la transformacin de datos en R n.clases=7 puntos=min(aves$Comisura)+(0:n.clases)*(max(aves$C omisura)-min(aves$Comisura))/n.clases hist(aves$Comisura) #Transformacion box-cox comisura1=((aves$Comisura)^(1/2)-1)/(1/2) comisura2=log(aves$Comisura) comisura3=((aves$Comisura)^(-1/2)-1)/(-1/2) comisura4=((aves$Comisura)^(-1)-1)/(-1)

Histogram of comisura

Frequency

0
0

10

20

30

40

10

15

20

25

30

35

comisura

Distribucin de frecuencia de los datos originales Asimetra=4.197753

puntos=min(comisura1)+(0:n.clases)*(max(comisura1)min(comisura1))/n.clases hist(comisura1, breaks=puntos) puntos=min(comisura2)+(0:n.clases)*(max(comisura2)min(comisura2))/n.clases hist(comisura2, breaks=puntos) puntos=min(comisura3)+(0:n.clases)*(max(comisura3)min(comisura3))/n.clases hist(comisura3, breaks=puntos)

puntos=min(comisura4)+(0:n.clases)*(max(comisura4)min(comisura4))/n.clases hist(comisura4, breaks=puntos)

Histogram of comisura1
30 30

Histogram of comisura2

25

20

Frequency

Frequency
2 4 6 comisura1 8

15

10

0
1.0

10

15

20

25

1.5

2.0 comisura2

2.5

3.0

3.5

Asimetra=2.135249

Asimetra=0.1219074

Histogram of comisura3
30 40

Histogram of comisura4

25

20

Frequency

Frequency

15

10

0
0.6

10

20

30

0.8

1.0

1.2 comisura3

1.4

1.6

0.7

0.8 comisura4

0.9

Asimetra= -1.82621

Asimetra= -3.704287

#Asimetria sum((comisura1-mean(comisura1))^3)/(44*sd(comisura1)^3) sum((comisura2-mean(comisura2))^3)/(44*sd(comisura2)^3) sum((comisura3-mean(comisura3))^3)/(44*sd(comisura3)^3) sum((comisura4-mean(comisura4))^3)/(44*sd(comisura4)^3)

aves$Alto.Narina 5
5 10

Alto.Narina

10

15

20

25

30

15

20

25

30

2
10

4
15 Comisura

comisura1 6 8

20 25 30

aves$Alto.Narina 5 10 15 20 25 30
5 10 15 20

Alto.Narina 25 30

1.0
5

1.5 2.0 comisura2 2.5 3.0 3.5


Comisura

10 15 20 25 30

aves$Alto.Narina 5 10 15 20 25 30

Alto.Narina 5 10 15 20 25 30

0.8

10

1.0

15

1.2 1.4 1.6

comisura3

Comisura 20 25 30

aves$Alto.Narina 5 10 15 20 25 30

Alto.Narina 5 10 15 20 25 30

0.6

5 10

0.7

15

comisura4 0.8 0.9

Comisura 20 25 30

También podría gustarte