Está en la página 1de 4

UNIVERSIDAD AUTÓNOMA DE AGUASCALIENTES

CENTRO DE CIENCIAS BÁSICAS


DEPARTAMENTO DE ESTADÍSTICA

PRÁCTICA DE LABORATORIO NÚMERO: 01

ACADEMIA : (este dato lo pueden ver en su Programa de Materia)


CARRERA :

MATERIA :
UNIDAD : 1
ELABORÓ : Dr. José Antonio Guerrero Díaz de León FECHA : 29/01/2021
M.C. Ma. Edubijes Esquivel Frausto

NOMBRE DE LA PRÁCTICA
Introducción a R

1 OBJETIVO
Conocer y aplicar los comandos y operadores básicos para trabajar con
datos en R

2 INTRODUCCIÓN
R es un lenguaje y entorno de programación para análisis estadístico y gráfico.

En R se trabaja mucho con vectores. La forma básica de construir vectores es usando


el comando c().
Digamos que tenemos los datos 2, 3, 0, 3, 1, 0, 0 y 1. Creamos un vector X con dichos
elementos:
x <- c(2,3,0,3,1,0,0,1)
El operador <- es el operador de asignación (está compuesto por un símbolo menor
que < y un guión medio −).
Al ejecutar el comando de arriba no debe aparecer nada (si aparece un mensaje en
letras rojas en que cometimos un error). Para ver que X realmente tiene los datos,
escribimos X en la línea de comandos y damos enter.

Operadores

Dado el vector podemos aplicarle funciones de vectores, como


sum(x): Suma de los elementos del vector
mean(x): Media de los elementos del vector
var(x): Varianza de los elementos del vector (la dividida entre n-1)
max(x):Valor máximo de los elementos del vector
quantile(x,0.73):El cuantil 0.73 (es decir, Cp para p=0.73) de los datos
length(x): Número de elementos en x
----------------------------------------------------------------
También se le pueden aplicar funciones que van de los reales en los reales, como
exp(x): Exponencial de cada uno de los elementos del vector
x^2: Cuadrado de todos los elementos del vector
x+1: Sumar 1 a todos los elementos del vector
En estos casos, el resultado es un vector resultado de aplicar la función a cada
elemento del vector.
-----------------------------------------------------------------
También podemos combinar funciones de los dos tipos:
sum(x^2): Suma de los cuadrados de los elementos del vector
sqrt(var(x)): Desviación estándar
sum(x)/length(x): Otra forma de calcular la varianza
-----------------------------------------------------------------
Podemos accesar a elementos individuales del vector, por ejemplo el tercer elemento:
x[3]
O a un rango de elementos:
x[2:5]
O a todos los elementos salvo uno en particular. Por ejemplo, si queremos todos los
elementos del vector menos el segundo:
x[-2]
O los elementos que cumplan alguna condición:
x[x>1]:Elementos de X que son mayores que 1

Creación de vectores

Como son importantes los vectores, hay que saber como construirlos:
con el comando c() como ya lo vimos
Un rango de enteros:
x<-1:10
Si no queremos que vayan de 1 en 1:
x<-seq(1,10,by=2)
O un número repetido varias veces:
x<-rep(5,3)
Leyendo los datos de un archivo (lo veremos más adelante)
O combinaciones:
x<-c(1,rep(5,3),3:7,seq(1,15,by=3))

Manejo de datos

Datos tipo I
Ya vimos que los datos en R son vectores, por ejemplo:
x <- c(1,2,3,1,2,4,2,2,3,3,2,4,4)
Cuando son pocos datos, podemos trabajar con ellos con los datos en forma extensiva.
Datos tipo II
En algunas ocasiones es mejor trabajar con ellos usando tablas de frecuencias. Por
ejemplo, los datos chickwts (ya vienen cargados en R) ya son difíciles de visualizar en
conjunto.
Pero podemos crear tablas de frecuencias de, por ejemplo, el tipo de alimento usado:
table(chickwts$feed)
Podemos obtener el promedio de los pesos de los pollos:
mean(chickwts$weight)
O solamente el promedio de los pesos para los pollos que usaron el alimento
horsebean:
mean(chickwts$weight[chickwts$feed=="horsebean"])
Si quisiéramos los promedios de los pesos para los diferentes tipos de alimento sería
algo tedioso, así que podemos separar los datos en base a esa variable:
Wsep <- split(chickwts$weight,chickwts$feed)
Y así podemos obtener el promedio de la siguiente manera:
mean(Wsep$horsebean)
Queríamos las medias de los pesos por tipo de alimento, para eso usamos:
sapply(Wsep,mean)
Datos tipo III
Si el número de posibles valores es muy grande, conviene tal vez mejor agruparlos por
intervalos. Por ejemplo, para los datos BMIdata (ver
http://wiki.stat.ucla.edu/socr/index.php/SOCR Data BMI Regression
para más información):
ruta<-file.choose()
x<-read.table(ruta,sep=",",header=TRUE)
Podemos agrupar las edades (no separar, porque no hay una variable factor de por
medio) con
I <- cut(x$Age,c(20,30,40,50,60,70,80,90))
o con
I <- cut(x$Age,seq(20,90,10))
Esto crea una nueva variable I que contiene el intervalo asociado a cada dato de edad.
Podemos ver cuantos datos hay en cada intervalos:
table(I)
Esta nueva variable I la podemos usar para separar datos, por ejemplo los pesos:
Wsep <- split(x$Weight,I) Y podemos calcular la media por grupos de edades:
sapply(Wsep,mean)

3 PLANTEAMIENTO
Para esta práctica introductoria, hay que hacer lo siguiente:
Parte I
1. Crear un vector con los siguientes elementos: 21, 20, 9, 3, 24, 14, 5, 21, 9, 24, 20,
22,
12 y calcular la media y la desviación estándar.
2. Extraer los valores del vector que sean mayores a 15

Parte II
1. Crear otro vector que contenga los numeros entre 10 y 100, pero de tres en tres (es
decir, 10,13,16,...)
2. Calular la mediana del vector (función median)
3. Extraer los valores del vector que son menores que la mediana

Parte III
1. Lea el archivo de datos BMIdata en R
2. Agrupe los datos de la circunferencia de la rodilla (X$KneeCircumf) en intervalos
con amplitud de 5cm, comenzando de 30 y terminando en 50 (30,35,...,50).
3. Use la agrupación del inciso anterior para separar los datos de altura (x$Height) y
calcular la media de altura por cada grupo.
4. En base a las medias del inciso anterior, responda: ¿La circunferencia de la rodilla
es directamente proporcional con la altura de la persona? (i.e. cuando una aumenta la
otra también.)

Parte IV
Busque (usando internet) para que sirve y como se usa la función “sample” de R. En
particular especifique para que sirve el parámetro “replace” de dicha función. Muestre
un ejemplo del uso de esta función y explique el resultado.

También podría gustarte