Está en la página 1de 14

Lenguaje R

Historia
Antecedentes
• 1976 en Laboratorios Bell, el
lenguaje S.
• Fue desarrollado
principalmente por John
Chambers, después se le
unieron al proyecto Rick
Becker y Allan Wilks
• S no es software libre
Antecedentes
• El lenguaje R es un proyecto de
software libre usado también para
análisis estadístico y gráfico,
desarrollado en un principio por
Robert Gentleman (EU) y Ross Ihaka
(Nueva Zelanda) en el Departamento
de Estadística de la Universidad de
Auckland en agosto de 1993
Antecedentes
• Su desarrollo actualmente es
responsabilidad del R Development
Core Team
• Un paquete es una serie de programas
que se distribuyen conjuntamente, y
un lenguaje de programación es un
dialecto artificial diseñado hacernos
entender con la computadoras
Antecedentes
• En R contamos con paquetes para
resolver problemas estadísticos
• A su vez, R es también un lenguaje de
programación
Título y diseño de contenido con
gráfico
Estadística Descriptiva

Esta foto de Autor desconocido está bajo licencia CC BY


Funciones Estadísticas Básicas

mean() Media
var() Varianza de la muestra • Para activar estos
comandos, es necesario
sd() Desviación Estándar de la muestra precargar la librería
median() Mediana “moments”de Internet.

quantile(,type=6) Resumen pentanumérico • Paquetes/Instalar


skewness() Coeficiente de asimetría* paquetes/Mexico/moments

kurtosis() Coeficiente de Curtosis*


stem() Diagrama de tallo y hojas
Ejercicio. Obtener las estadísticas
básicas de los siguientes datos:

2000 2500 1800 2400 2800


2200 2200 2700 2300 2400
3100 1900 3000 2200

• Para capturar los datos:


>datos<-scan()
Gráfica de barras
• Un estudio hecho al conjunto de los
20 alumnos de una clase para • > fi<-c(6,4,1,9)
determinar su grupo sanguíneo ha
dado el siguiente resultado: • > names(fi)<-
c("A","B","AB","O")
• > barplot(fi)
>alumnos<-c(12,3,9,6)
Gráfica de Sectores > porcentaje<-alumnos/sum(alumnos)*100
> porcentaje
• En una clase de 30 alumnos, 12
juegan a baloncesto, 3 > etiquetas<-paste(porcentaje,"%",sep=" ")
practican la natación, 9 juegan >pie(porcentaje,labels=etiquetas,clockwise=T,
al fútbol y el resto no practica main=“PRÁCTICA DE DEPORTES")
ningún deporte.
>color<-c("blue","green","red","purple")
>pie(porcentaje,labels=etiquetas,clockwise=T,
main=“PRÁCTICA DE DEPORTES",col=color)
>legend("topright",c("Baloncesto","Natación
","Futbol","Sin deporte"),cex=0.8,fill=color)
Histograma
• Obtenga el histograma de los siguientes datos:

2000 2500 1800 2400 2800


2200 2200 2700 2300 2400
3100 1900 3000 2200

>hist(datos)
Tabla de Frecuencias en R

Obtener datos con plot=F, y guardarlos en una Guardar en variables los vectores de Límite
Capturar los datos Graficar el histograma y ajustarlo
variable inferior de los intervalos

Usando el vector de frecuencias, se obtiene la


Determinar y guardar los valores de los límites De la variable de datos, obtener las De la variable de datos, obtener las marcas de
frecuencia acumulada con el comando
superiores de los intervalos frecuencias y guardarlas en una variable clase y guardarlas en una variable
cumsum(), y se guarda en una variable

Para la frecuencia acumulada relativa, la


Usando el vector de frecuencias se obtiene la variable que contiene a la frecuencia Se unen todas las variables: Finalmente se utiliza el comando View() para
frecuencia relativa y se guarda en una variable acumulada se divide entre la suma de las tabla=data.frame(cbind(LI,LS,f,m,fr,fa,fra)) observar el resultado final
frecuencias y se guarda en una variable
Inferencia Estadística

Esta foto de Autor desconocido está bajo licencia CC BY-NC