Prueba 1

También podría gustarte

Está en la página 1de 5

Tarea 0

Fabrizio Andrade
August 18, 2015
Primero vamos a cargar las bases de datos de msleep.
library (ggplot2)
head (msleep)
##
##
##
##
##
##
##
##
##
##
##
##
##
##

name
genus vore
order conservation
1
Cheetah
Acinonyx carni
Carnivora
lc
2
Owl monkey
Aotus omni
Primates
<NA>
3
Mountain beaver Aplodontia herbi
Rodentia
nt
4 Greater short-tailed shrew
Blarina omni Soricomorpha
lc
5
Cow
Bos herbi Artiodactyla domesticated
6
Three-toed sloth
Bradypus herbi
Pilosa
<NA>
sleep_total sleep_rem sleep_cycle awake brainwt bodywt
1
12.1
NA
NA 11.9
NA 50.000
2
17.0
1.8
NA
7.0 0.01550
0.480
3
14.4
2.4
NA
9.6
NA
1.350
4
14.9
2.3
0.1333333
9.1 0.00029
0.019
5
4.0
0.7
0.6666667 20.0 0.42300 600.000
6
14.4
2.2
0.7666667
9.6
NA
3.850

Ahora que hemos cargado las bases de datos continuaremos con el anlisis de los datos para las grficas.
Antes de proceder verificaremos el tipo de entrada que tienen las variables.
str (msleep)
## 'data.frame':
## $ name
:
## $ genus
:
## $ vore
:
## $ order
:
## $ conservation:
## $ sleep_total :
## $ sleep_rem
:
## $ sleep_cycle :
## $ awake
:
## $ brainwt
:
## $ bodywt
:

83 obs. of 11 variables:
chr "Cheetah" "Owl monkey" "Mountain beaver" "Greater short-tailed shrew" ...
chr "Acinonyx" "Aotus" "Aplodontia" "Blarina" ...
Factor w/ 4 levels "carni","herbi",..: 1 4 2 4 2 2 1 NA 1 2 ...
chr "Carnivora" "Primates" "Rodentia" "Soricomorpha" ...
Factor w/ 7 levels "","cd","domesticated",..: 5 NA 6 5 3 NA 7 NA 3 5 ...
num 12.1 17 14.4 14.9 4 14.4 8.7 7 10.1 3 ...
num NA 1.8 2.4 2.3 0.7 2.2 1.4 NA 2.9 NA ...
num NA NA NA 0.133 0.667 ...
num 11.9 7 9.6 9.1 20 9.6 15.3 17 13.9 21 ...
num NA 0.0155 NA 0.00029 0.423 NA NA NA 0.07 0.0982 ...
num 50 0.48 1.35 0.019 600 ...

Resulta interesante comparar vore contra bodyweight. Sin embargo, en el dataframe de msleep exista algo
de ruido pues algunos valores saltaban mucho en el rango y no permitan observar nada. As que quitaremos
los valores que saltan as como los valores NA para poder observar correctamente lo que se busca.
#Los valores que causan conflicto son el 21 y 36
f1<- msleep [1:20, c(1,3,11)]
f2<- msleep [22:35, c(1,3,11)]
1

f3<- msleep [37:83, c(1,3,11)]


#Juntamos los valores depurados en una sola lista
Lista<- Reduce (function(x,y) merge (x,y, all=TRUE), list (f1, f2, f3) )
#Ahora quitamos los NA
mejorLista<- na.omit(Lista)
ggplot(mejorLista, aes (x=vore, y=bodywt)) + geom_jitter()

bodywt

750

500

250

0
carni

herbi

insecti

omni

vore
Ahora, podemos ver como el peso de los animales segn su Vore se concentra en ciertas regiones y el rango
que pueden alcanzar.
Otro dato que resulta interesante analizar es el comparativo de las horas dormidas segn el orden del animal.
#Verifiquemos que no haya omisiones de datos
# msleep[ , c(4,6)]
#Ya que no hay omisiones de datos procedemos con la grfica
ggplot(msleep, aes( x=sleep_total, y=order)) + geom_point()

order

Soricomorpha
Scandentia
Rodentia
Proboscidea
Primates
Pilosa
Perissodactyla
Monotremata
Lagomorpha
Hyracoidea
Erinaceomorpha
Diprotodontia
Didelphimorphia
Cingulata
Chiroptera
Cetacea
Carnivora
Artiodactyla
Afrosoricida
5

10

15

20

sleep_total
En esta grfica podemos observar agrupaciones acotadas de datos de horas dormidas segn el orden del
animal. De igual manera podemos observar que la mayora de los animales duermen entre 7.5 y 15 horas.
Adems en los extremos de la grfica [(0 a 2.5) y (17.5 a 20)] es posible notar que hay un menor nmero de
animales que duermen ms de 17.5 horas a los que duermen menos de 2.5 horas.
Por ltimo se realizaremos una grfica comparando el Ciclo Rem contra las Horas Dormidas. El resultado se
logr observar fue el que ms interesante resulto de esta tarea.
#Notemos que automaticamente omite las valores NA
ggplot(msleep, aes(x=sleep_total, y=sleep_rem)) +geom_jitter()
## Warning: Removed 22 rows containing missing values (geom_point).

sleep_rem

0
5

10

15

20

sleep_total
Al ver esta grfica la podemos asociar con una funcin exponencial. Ya que an no contamos con las
herramientas necesarias para superponer una exponencial sobre los datos registrados nos ayudaremos de una
grfica con lneas para poder visualizar mejor la forma.
ggplot(msleep, aes(x=sleep_total, y=sleep_rem)) +geom_line()

sleep_rem

0
5

10

15

20

sleep_total
Luego, podemos ver como existe una relacin exponencial entre las horas dormidas y el ciclo rem de los
animales observados.

También podría gustarte