Está en la página 1de 9

Prye-1

Informe Taller R
Santiago Alba

Introducción:
En el siguiente informe se busca dar a conocer los resultados del taller dejado en
clase obtenidos gracias al programa de estadística R.
Resultados:
Como primera instrucción el taller hace la introducción sobre el ingreso de datos
que es la parte fundamental ya que gracias a estos podremos realizar lo que nos
pedirán. Para introducir los datos necesitamos un nombre para la función algo
escrito así NOMBRE=c(). Al introducir los datos el programa R los clasificara en
caracteres o números y determinar qué tan grande es el vector (cantidad de datos
introducidos).
Al seguir las instrucciones dadas en el taller obtenemos 3 vectores los cuales son:
 SANGRE=c("O","A","B","O","O","O","O","O","AB","O","O","O","O","B","O","B"
,"O","A","A","A","O","A","A","B","AB","A","B","A","A","A","A","O","A","O","O","
A","A","O","O","A","O","O","O","O","A","A","A","A","A","AB")
 EDAD=c(29,34,26,21,39,40,26,20,26,32,25,26,36,37,34,28,21,38,28,34,21,
38,31,20,33,40,31,32,29,31,37,22,27,28,20,30,35,22,32,37,23,33,38,25,26,
27,34,30,21,38)
 PESO=c(65,61,76,78,80,67,73,71,61,75,78,75,67,73,65,61,75,74,80,64,69,
80,64,77,76,80,60,77,69,66,76,74,60,63,72,69,67,72,71,73,76,80,76,70,77,
62,73,61,65,75)
Ya obtenidos los vectores podemos responder las preguntas que nos realiza el
taller acerca de que tan grandes son los vectores en los que podemos decir que
los 3 contienen 50 datos, pero se diferencian en que el vector SANGRE es de
caracteres y los vectores PESO y EDAD son de números.

Tras haber hecho la primer parte del taller se nos explica como crear una base de
datos a partir de una matriz, para esto necesitamos darle un nombre a esta matriz
y declarar los vectores que harán parte de esta con el código cbind().
Teniendo esta información acerca del código se nos pide hacer una matriz con los
vectores de EDAD, PESO y SANGRE el cual quedaría así:
 Ejemplo1=cbind(SANGRE,EDAD,PESO)
Este código genera una matriz la cual nos dice la cantidad de datos contenidos
que son 150 y el tipo de objeto que es un carácter, pero al tener los datos en
forma de matriz no es posible trabajar funciones de forma directa así que tenemos
que convertir esta matriz a una base de datos con el código data.frame() lo cual
sería la siguiente instrucción y el código quedaría algo así:
 Ejemplo2=data.frame(Ejemplo1)
Obtenida la base de datos podemos resolver las preguntas siguientes en las que
se puede decir que el tipo de objeto de la base de datos es un carácter y que esta
contiene 3 variables. Seguido a esto se nos explica el código names() con el que
podremos conocer el nombre de las 3 variables y el código view() con el que
podemos ver en forma de tabla de valores la base de datos, en este caso
quedarían así:
 names(Ejemplo2)
 view(Ejemplo2)

En la tercer parte del taller se nos explica como editar una base de datos con el
código edit() el cual utilizaremos con otros datos dados que son los siguientes:
 Año=c(1900,1910,1920,1930,1940,1950,1960,1970,1980,1990,2000)
 Matrimonios=c(9.3,10.3,12,9.2,12.1,11.1,8.5,10.6,10.6,9.8,8.3)
 Divorcios=c(0.7,0.9,1.6,1.6,2,2.6,2.2,3.5,5.2,4.7,4.2)
Con estos datos y sumado a las instrucciones anteriores podremos editar la base
de datos y ver la edición con los siguientes pasos:
 Matrimonios=data.frame(Matrimonios)
 Matrimonios=edit(Matrimonios)
 Matrimonios=View(Matrimonios)

Como cuarta parte del taller nos explican como hacer una tabla de frecuencia a
partir de los datos anteriormente (vector SANGRE). Para esto tendremos que
declarar esta tabla con su respectivo nombre y usando en código table() como se
muestra a continuación:
 TABLASANGRE=table(SANGRE)
 View(TABLASANGRE)
Luego se nos explica como determinar las proporciones de la tabla con el código
prop.table() y quedaría algo así:
 prop.table(TABLASANGRE)
Tras esta instrucción se nos pide mostrar las proporciones de cada grupo de tipo
de sangre y el código quedaría así:
 PROPORCIONSANGRE=table(prop.table(TABLASANGRE))
 View(PROPORCIONSANGRE)
También se nos pide introducir el código round(PROPORCIONSANGRE,2) el cual
nos indica que es una frecuencia y round(PROPORCIONSANGRE*100,1) que nos
muestra un porcentaje. Lego de esto pide introducir los datos en una tabla y el
código sería el siguiente:
 prop.table(TABLASANGRE,round(PROPORCIONSANGRE*100,1))

Tipo de sangre donantes porcentaje


A 20 40
B 5 10
AB 3 6
O 22 44

Tras aplicar estos códigos el taller nos explica como construir intervalos de clase
para una variable de tipo cuantitativo utilizando el código cut(x,break=5) y nos
explica utilizando el vector SANGRE:
 TABLAEDAD=table(cut(EDAD,breaks = 5))
Seguido a lo anterior el taller nos muestra como hallar la frecuencia acumulada
para lo cual se utilizará el código cumsum() y lo explica utilizando el vector EDAD
como se venía trabajando y adicionalmente nos pide hacer una tabla de
proporciones para la variable edad:
 prop.table(TABLAEDAD)
 PROPORCIONEDAD=table(prop.table(TABLAEDAD))
 prop.table(round(PROPORCIONEDAD*100,1))
 ACUMULAEDAD=cumsum(TABLAEDAD)
 cumsum(ACUMULAEDAD)
 prop.table(TABLAEDAD,round(ACUMULAEDAD *100,1))

Intervalo donantes porcentaje


1 20 20
2 24 35
3 20 25
4 16 15
5 20 5
Como quinta parte el taller explica la generación de datos a partir de vectores, en
esta parte nos explican como realizar un grafico en forma de pie con el código
pie() y otros subcódigos que se pondrán dentro de este como main= que se utiliza
para agregar un título, sub= que se utiliza para agregar un subtítulo, col=c(“”) que
se utiliza para cambiar colores, labels=c() que se utiliza para agregar los
porcentajes como se muerta en el siguiente código y nos pide cambiar el subtítulo
y revisar los porcentajes:
 pie(PROPORCIONSANGRE,main=”Tipos de sangre”, sub=”Tatiana
Jimenez”, col=c(“red”, “orange”, “green”), label=c(“A, 40%”,“B, 10%”,“AB,
6%”,“O, 44%”)

 pie(PROPORCIONSANGRE,main="Tipos de
sangre",sub="Porcentajes",col=c("red","orange","green","blue"),labels=c("A,
40%","B,10%","AB,6%","O,44%"))
Tras conocer el grafico en forma de pie se nos enseña como hacer un grafico de
barras con el código barplot() y subcódigos como ylab=”” y xlab=”” que ese utiliza
para las instrucciones de los ejes y se pide introducir el código y hacerle unos
arreglos luego:
 barplot(TABLASANGRE,main="Tipos de sangre",sub="Tatiana
Jimenez", xlab=”Tipos de sangre”, ylab=”Cantidad de
donantes”,col=c("purple","yellow","green","blue"),ylim=c(0.25))
 barplot(TABLASANGRE,main="Tipos de sangre",sub="Porcentajes de
sangre ", xlab=”Tipos de sangre”, ylab=”Cantidad de
donantes”,col=c("red","orange","yellow","black"),ylim=c(0.25))
Ya conociendo el diagrama de barras nos falta conocer el de tallos y hojas el cual
se hace utilizando la variable stem() y nos pide realizar uno con la variable PESO
que quedaría de la siguiente manera:
 stem(PESO)
Después de conocer el diagrama de tallos y hojas nos muestra como se realiza un
histograma con el código hist() y nos pide hacer esto con la variable EDAD y con
más modificaciones son subcódigos a este gráfico:
 hist(EDAD, main="Comportamientos de PESO",sub="Santiago Alba
2169396", xlab=”Peso”, ylab=”Cantidad de donantes”,col=c("green"))
Como ultimo modelo grafico se nos enseñan como hacer curvas de densidad y su
código lines(density()) y también si se quiere se puede utilizar el código
hist(x,freq=false), en donde freq es una condición opcional para que se genere
esta curva de densidad.

Como sexta parte del taller se nos muestra como se realiza una tabla cruzada y
nos pone como ejemplo el siguiente código:
 TABLACRUZADA=table(cut(EDAD,breaks = 4),SANGRE)
Luego se explica la construcción condicional por fila utilizando el código
prop.table(x,2) como se muestra a continuación:
 TABLACONDICIONAL=prop.table(TABLACRUZADA,2)
Tras esta explicación se nos pide mezclar lo aprendido con los gráficos y estas
tablas cruzadas y el resultado de los códigos es el siguiente:
 barplot(TABLACONDICIONAL,main = "SANGRE Y EDAD",sub = "TATIANA
JIMENEZ",xlab = "TIPO DE SANGRE",ylab = "PROPORCION DE
DONANTES",ylim=c(0,0.50),col=c("blue","green","yellow","orange"),beside=
TRUE,legend.text=TRUE)
 legend("topleft",horiz = TRUE, legend = c("20-25","25-30","30-35","35-
40"),fill = c("blue","green","yellow","orange"),inset = c(0,0))

En la séptima parte del taller se explica el uso de códigos para las medidas de
tendencia central, como primer explicación nos muestran los códigos mean() y
median() que permiten hallar la media y la mediana de los datos de una variable
de tipo cuantitativo como se muestra a continuación:
 mean(PESO)
 median(PESO)
También se nos muestra como condicionar estos códigos para obtener resultados
más específicos dentro de la variable:
 mean(PESO[SANGRE=="B"])
 mean(PESO[EDAD<25])
De acuerdo con esto se nos pide hallar distintos datos de las variables de
SANGRE, PESO y EDAD condicionando los código específicamente para la
variable PESO:

 mean(PESO[SANGRE=="AB"])
70.66
 median(PESO[EDAD>30])
73
 mean(PESO[25<=EDAD&EDAD<=30])
68.75
 median(PESO[SANGRE!="B"])
72
Luego de tener una idea de como mostrar dichos resultados gracias a estos
códigos nos muestra como comparar estas medidas obtenidas con el código
tapply(x,GRUPO,FUNCION) y nos da un ejemplo con el siguiente el primer código
que se fija en la media y el segundo no piden cambiarla por la mediana:
 tapply(PESO,SANGRE,mean)
 tapply(PESO,SANGRE,median)
Dentro de esta séptima parte también nos explican el código a usar para obtener
medidas de posición que es quantile(x,probs=c()) y nos dan un ejemplo de su uso:
 quantile(EDAD,probs = c(0.25,0.75),type = 6)
 quantile(EDAD[SANGRE!="A"],probs = c(0.25,0.75),type = 6)
 quantile(EDAD[SANGRE!="A"|SANGRE!="AB"],probs = c(0.25,0.75),type =
6)
 tapply(EDAD,SANGRE,quantile,probs = c(0.10,0.60,0.95),type = 6)
Luego de tener un ejemplo nos pide resolver preguntas utilizando el código y las
variables PESO y SANGRE:

 quantile(PESO,probs = c(0.10,0.90),type = 6)
61.0-79.8
 quantile(PESO[SANGRE=="A"|SANGRE=="AB"|SANGRE=="B"|
SANGRE=="O"],probs = c(0.25,0.75),type = 6)
65,76
 quantile(PESO[SANGRE=="A"|SANGRE=="AB"|SANGRE=="B"|
SANGRE=="O"],probs = c(0.05,0.95),type = 6)
60.55-80
Como ultima medida se nos muestran los códigos var() y sd() que corresponden a
medidas de variabilidad y se nos pide resolver preguntas con la aplicación de
ellos:

 sd(PESO)
6.25
 sd(PESO[SANGRE=="O"])
4.90
 var(PESO[SANGRE=="A"])
var(PESO[SANGRE=="B"])
var(PESO[SANGRE=="O"])
var(PESO[SANGRE=="AB"])
48.30-68.3-24.05-70.33
Tras ver todas las medidas se nos da el código summary() también con
condicionales y discriminados vistos anteriormente y se nos pide resolver
preguntas aplicandolo:

 summary(PESO,type=6)
Min. 1st Qu. Median Mean 3rd Qu. Max.
60.00 65.25 72.50 70.98 76.00 80.00
 summary(PESO[SANGRE=="O"],type=6)
Min. 1st Qu. Median Mean 3rd Qu. Max.
63.00 69.25 72.50 72.36 75.75 80.00
 summary(PESO[SANGRE=="A"|SANGRE=="AB"|SANGRE=="B"|
SANGRE=="O"],type=6)
Min. 1st Qu. Median Mean 3rd Qu. Max.
60.00 65.25 72.50 70.98 76.00 80.00
Como última parte del taller se nos enseña como realizar un diagrama de caja y
bigotes con el código boxplot() y nos da un ejemplo en los que se puede apreciar
un cambio entre un código y otro el cual muestra los datos de acuerdo a los tipos
de sangre:
 boxplot(EDAD,main="Distribucion
edad",col=c("green","red","blue","purple"),sub="Tatiana
Jimenez",ylab="EDAD")
 boxplot(EDAD~SANGRE,main="Distribucion
edad",col="green",sub="Tatiana
Jimenez",ylab="EDAD",names=c("A","B","AB","O"))

También podría gustarte