Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lenguaje R
Una vez que los datos se han codificado, transferido a una matriz, guardado en un
archivo y “limpiado” los errores, el investigador procede a analizarlos.
𝑁𝑜 𝐴𝑏𝑠𝑡𝑟𝑎𝑐𝑐𝑖ó𝑛, 1 ≤ 𝑋̅ < 2
𝐴𝑏𝑠𝑡𝑟𝑎𝑐𝑐𝑖ó𝑛 𝑆𝑎𝑡𝑖𝑠𝑓𝑎𝑐𝑡𝑜𝑟𝑖𝑎, 2 ≤ 𝑋̅ < 3
𝑋̅ =
𝐴𝑏𝑠𝑡𝑟𝑎𝑐𝑐𝑖ó𝑛 𝐵𝑢𝑒𝑛𝑎, 3 ≤ 𝑋̅ < 3,5
{ 𝐴𝑏𝑠𝑡𝑟𝑎𝑐𝑐𝑖ó𝑛 Ó𝑝𝑡𝑖𝑚𝑎, 3,5 ≤ 𝑋̅ ≤4
Análisis de Datos en Lenguaje R
Instalaciones de R y RStudio:
Imagen 1
2
Análisis de Datos en Lenguaje R
RStudio es una interfaz (IDE) que nos permite trabajar de manera más fluida con el
programa R. Tiene el siguiente aspecto:
Una vez abierto nuestro programa debemos abrir un nuevo script como muestra
la imagen.
3
Imagen 2
Análisis de Datos en Lenguaje R
Imagen 3
4
Análisis de Datos en Lenguaje R
Imagen 4
R trae una cantidad limitada de herramientas para el análisis de datos por lo que se
deben instalar paquetes que contienen mayores herramientas. Se puede hacer a
través de comandos, por ejemplo, install.packages(“readxl”) indicando entre
comillas el nombre del paquete a descargar o se puede realizar en packages en el
cuadrante inferior derecho y luego install y buscar el nombre del paquete como en la
imagen:
Análisis de Datos en Lenguaje R
Imagen 5
6
Cabe señalar que, como se mencionó, para utilizar un paquete este debe estar
instalado previamente, luego de eso para “llamarlo” se debe realizar con el comando
library(readxl)
En la sección help puede escribir el nombre del paquete para obtener mayor
descripción del mismo.
Imagen 6
Descriptivo.R
#Instalamos las librerias
library(readxl)
library(dplyr)
##
## Attaching package: 'dplyr'
library(ggplot2)
library(ggcorrplot)
Análisis de Datos en Lenguaje R
library(e1071)
library(ROCR)
library(class)
library(rpart)
library(randomForest)
## randomForest 4.6-14
##
## Attaching package: 'randomForest'
library(reshape)
##
## Attaching package: 'reshape' 8
## The following object is masked from 'package:class':
##
## condense
library(kknn)
library(psych)
##
## Attaching package: 'psych'
View(data)
head(data)
## # A tibble: 6 x 11
## Nº Modalidad Edad Semestre Pregunta1 Pregunta2 Rotular Reducc
ionConten…
## <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
<dbl>
## 1 1 Diurna 25 5 2 1 4
1
## 2 2 Diurna 26 5 1 1 1
1
## 3 3 Diurna 21 5 2 1 1
1 9
## 4 4 Diurna 21 5 1 1 1
1
## 5 5 Diurna 24 5 3 1 1
1
## 6 6 Diurna 30 3 2 1 1
2
## # … with 3 more variables: Titulo <dbl>, PromedioPreguntas <dbl>, `
Abstraccion
## # final` <chr>
summary(data)
mean(data$Edad)
## [1] 26.98246
median(data$Edad)
## [1] 25
10
##Calcular el rango de una variable (edad)
range(data$Edad)
## [1] 20 49
min(data$Edad)
## [1] 20
max(data$Edad)
## [1] 49
var(data$Edad)
## [1] 38.68995
Análisis de Datos en Lenguaje R
sd(data$Edad)
## [1] 6.220125
skew(data$Edad)
## [1] 1.577707
kurtosis(data$Edad)
## [1] 2.559568
boxplot(data$Edad)
Imagen 7
11
Análisis de Datos en Lenguaje R
##
## Diurna Vespertina
## 60 54
Imagen 8
12
Imagen 9
##Variable Semestre,
##
## 3 4 5 6 7 8
## 10 3 17 1 80 3
Imagen 10
Imagen 11
##Matriz de correlaciones
##Correlaciones
corr<-data.frame(ED=data$Edad,SE=data$Semestre,P1=data$Pregunta1,
P2=data$Pregunta2)
15
correlacion <- round(cor(corr), 2)
#Matriz de correlaciones
ggcorrplot(correlacion, hc.order = FALSE,
outline.col = "white",
ggtheme = theme_minimal(),
colors = c("#6D9EC1", "white", "#E46726"), lab= T) +
labs(title="Correlacion de las Variables", subtitle = "Nivel de Resp
usta de Encuesta")+
theme(legend.position="right",plot.title = element_text(size = 18, h
just = 0.5),plot.subtitle = element_text(size = 18, hjust = 0.5))
Análisis de Datos en Lenguaje R
Imagen 12
16
Análisis de Datos en Lenguaje R
Bibliografía
2. https://www.r-project.org/
3. https://www.rpubs.com
17