Está en la página 1de 12

Estadı́stica descriptiva en R

Carlos Acevedo

Facultad de Ciencias Farmacéuticas y Alimentarias

R es un paquete estadı́stico gratuito que puede ser descargado de la siguiente dirección:


https://cran.r-project.org/.
El primer paso que debemos seguir es guardar nuestros datos en una hoja de excel, en el encabezado
debe ir el nombre de la variable.

Luego debemos guardar los datos como formato .csv, en archivo, guardar como,

1
Le damos un nombre al archivo, en nuestro caso, Estatura Estudiantes Qf, guardar, aceptar, si.

Luego abrimos R, podemos limpiar la consola con Ctrl + L y procedemos a abrir un nuevo script
desde la ventana de archivo. Hay que diferenciar la consola con el script, en el script se escribe el
código, y en la R consola se pueden observar los resultados.

2
Cuando se haya abierto el nuevo escript, lo primero que debemos hacer es preguntar a R donde
debemos guardar el archivo .csv, en nuestro caso, Estatura Estudiantes Qf, para esto utilizaremos
la función, getwd(), se selecciona esta función y damos clic a la ventana correr linea o seleccionar,
otra forma es ubicar el puntero del mouse en la lı́nea que deseamos correr y Ctrl+ R.

En la consola aparece la ruta en la cual debemos ubicar el archivo .csv. ”C:/Users/l/Documents”.

Después de ubicar nuestro archivo en esa ruta, debemos ingresar la siguiente linea:
Datos=read.csv(”Estatura Estudiantes Qf.csv”,sep =”;”,dec=”,”)
En ”Datos” , almacenaremos los datos importados desde excel, guardados en Estatura Estudiantes Qf.csv.
La función read.csv importa los datos desde excel, guardados en formato csv. Debe observar muy
bien la estructura, siempre entre comillas, y si sus datos tienen números decimales (dec=), indicar si
van separados por puntos o comas. En nuestro caso por comas. Después de correr la lı́nea,( ubique
el puntero en la linea y Ctrl+R) debe aparecer en la consola el código en rojo, si aparece en azul,
hay un error.
Luego debe ingresar las lı́neas, attach(Datos), y View(Datos), esta última para observar los datos
almacenados en el objeto ”Datos”. Seleccionar y correr ambas lı́neas.

3
Luego de seguir estos pasos, debemos cargar los siguientes paquetes, agricolae, plotrix, RcmdrMisc.
Estas librerı́as nos permiten elaborar la tabla de frecuencias, histogramas, diagrama de pastel, de
caja, además, calcular media, varianza, percentiles. Para cargarlas debemos ir a paquetes, luego
instalar paquetes. Allı́ seleccionamos Colombia y buscamos los paquetes que necesitamos, luego
OK.

4
5
Después de realizar estos pasos, debemos llamar la librerı́a agricolae, y correr esta con Ctrl +R.
Luego de correrla debe aparecer en la R consola como se muestra a continuación

Luego de cargar la librerı́a, procedemos a construir la tabla de frecuencias utilizando el comando


Clases=sturges.freq(Estatura)
En el objeto Clases almacenaremos la información obtenida con el comando sturges.freq, recordemos
que a los datos le dimos el nombre de Estatura. Seguidamente le podemos indicar a R que nos muestre
la información almacenada en Clases.

6
El objeto Clases está compuesto de, $maximum,$minimum,...,$breaks. breaks, indica los extremos
de cada intervalo o clase.
Para elaborar la tabla de frecuencias debemos escribir el código:
m=graph.freq(Estatura,Clases$breaks,right=FALSE,plot=FALSE)
graph.freq nos ayuda a elaborar la tabla de frecuencias e histograma, almacenado en el objeto
m. Después del paréntesis debe ir el nombre de la variable, en nuestro caso, Estatura, luego las
clases en que está dividida la información. Clases$breaks, con signo pesos, invoca sólo a breaks, si
colocamos sólo Clases, R nos muestra un error, dado que Clases está compuesto de otras variables
como $maximum, $amplitude. A continuación encontramos el comando right=FALSE, indica que el
intervalo o clase es semiabierto a derecha, [a,b), sı́ right= TRUE, el intervalo o clase es semiabierto
a izquierda,(a,b].
A continuación le pedimos a R través del comando, z=table.freq(m), que nos elabore la tabla de
frecuencias, con los datos almacenados el el objeto m, observe que a su vez, almacenamos los datos
en el objeto z. Al escribir z en el código, le pedimos a R que nos muestre la información almacenada
allı́.

7
El comando, graph.freq(Estatura,Clases$breaks,frequency=2,right=FALSE,plot=TRUE,col=”red”
main=”Estatura Estudiantes Qf ”, ylab=”Frecuencia relativa”, xlab=”Estatura”), nos
permite elaborar el histograma. Después del paréntesis debemos colocar la variable, seguidamente las
clases, frequency=2, permite que sobre el eje y aparezca la frecuencia relativa, cuando frequency=1,
sobre el eje y aparece la frecuencia absoluta, col=”red”, entre comillas, nos permite dar el color que
deseemos al histograma, main=””, permite darle nombre al histograma, ylab=””, da nombre al eje
y, para nuestro caso es frecuencia relativa, xlab=””, da nombre al eje x.

8
Elaboración del Diagrama de Pastel

Para elaborar el diagrama de pastel debemos cargar la librerı́a plotrix.


Después de cargar esta librerı́a, podemos crear un ”’vector” que nos permitirá darle un nombre a
cada sector. En el objeto vec almacenaremos los nombres. R nos permite hacer esto a través de la
función c( , , ), el cual nos ayuda a ingresar información en forma de vector. Por ejemplo a=c(1,2,3),
indica que en el objeto a se almacenaron los elementos, 1,2 y 3.
En vec=c(”Muy bajos”,”bajos”,”Medio”,”Medio alto”,”alto”,”Muy alto”), se almacenaron los nom-
bres, de cada sector, para caracteres de este tipo, debemos ingresarlos entre comillas. Usted puede
nombrar los sectores como desee, o asignarles el intervalo que representan
c(”[1.40,1.48)”,”[1.48,1.56)”,...,”[1.80,1.88)”).

9
Además del vector que nos permite darle nombre a cada sector, debemos crear un nuevo vector,
este vector debe tener entre sus componentes las frecuencias absolutas de la tabla de frecuencias:
vec1=c(1,7,7,9,9,5)
pie3D(vec1,labels=vec,explode=0.1,main=”Estatura Estudiantes Qf”,labelcex=0.9)
La función pie3D nos ayuda a elaborar el diagrama de pastel, a continuación del paréntesis encon-
tramos las frecuencias absolutas almacenadas en el vector vec1. En labels=vec, me permite darle
nombre a cada sector, recordemos que en el objeto vec se almacenaron los nombres para cada sector.
explode me permite separar los sectores del diagrama de pastel, y main darle nombre al gráfico. la-
belcex permite aumentar o disminuir el tamaño de las etiquetas almacenadas en vec. start=0 indica
el ángulo a partir del cual iniciamos a dibujar los sectores. Luego corremos la lı́nea.

10
Elaboración del Diagrama de Caja

Para la elaboración del diagrama de caja y bigote utilizaremos la función boxplot.


boxplot(Estatura,main=” Diagrama de caja Estatura Estudiantes”,ylab=” Estaturas”, xlab= ” ”,
col=c(”yellow”), horizontal=FALSE)
Luego del paréntesis se debe ingresar la variable, en nuestro caso Estaturas, seguido va el nombre
del diagrama, ylab y xlab me permiten rotular los ejes coordenados, col, me permite darle color al
diagrama. horizontal, si es TRUE, la posición del diagrama es horizontal, si es FALSE, vertical.

11
Resumen de Estadı́sticos

Para calcular media, desviación estándar , cuartiles, debemos cargar la librerı́a RcmdrMisc, la
función numSummary nos ayudará a calcular estos valores,
numSummary(Estatura)
Resumen de estadı́sticos de la variables estatura.

Podemos calcular el resumen de estadı́sticos sin la necesidad de recurrir a la librerı́a RcmdrMisc,


podemos calcular los cuartiles a través de la función quantile(Tiempo), la media con la función
mean(Tiempo), y desviación estándar con la función sd(Tiempo).

Usted puede recurrir a la ayuda en lı́nea de R escribiendo ?? función, en la R consola. Por ejemplo,
??sturges.freq.

12

También podría gustarte