Está en la página 1de 38

Fase 4 Proyecto con procesamiento estadístico.

Presentado por:

Anyi Paola Polanía Betancour

Presentado a:

Luis Alberto Cáceres Torres

Director Curso de estadistica descriptivas (Agrarias)

Curso:

Estadistica Descriptiva para Agrarias

Programa: Agronomía

Universidad Nacional Abierta y a Distancia (UNAD)

CEAD: Acacias

Mayo de 2021
Introducción
A continuación se presenta la recopilación de datos después de
realizar la aplicación de la encuesta en el Centro Educativo a
Guacamayas a estudiantes y padres de familia del Establecimiento,
esta se hizo a 30 integrantes de 4 veredas diferentes, El Delirio,
Guacamayas, Bonanza 1 y Bonanza 2.
Objetivo general
Realizar la investigación de un contexto para recopilar
información descriptiva, cualitativa a partir de aplicación de
encuestas.

Objetivos específicos

 Aplicar la encuesta se aplicó a padres de familia y


estudiante del Centro Educativo Guacamayas.
 Realizar encuesta sobre la vereda donde viven, el peso de
los integrantes y la cantidad de personas que viven en casa.
Defina un área de trabajo donde se puedan obtener
datos de variables continuas, discretas y cualitativas.
Para realizar la encuesta y así tomar los datos que se están solicitando para
la actividad es el Centro Educativo Guacamayas Sede San Francisco,
ubicado en el Municipio de Mapiripán.

FACHADA DEL CENTRO DONDE SE


REALIZÓ LA ENCUESTA

1. Indique la ubicación del sitio fuente de los datos: institución, municipio, vereda y/o finca si
aplica. El informe debe presentar los detalles de la locación elegida que permitan entender el
contexto sobre el cual se realiza la investigación.

El lugar donde se realizó la investigación y recopilación de datos es un establecimiento educativo,


denominado Centro Educativo Guacamayas del Municipio de Mapiripán Meta, está ubicada a unas 4
horas del Municipio como tal, la encuesta se realizó a los estudiantes de la Sede y padres de familia
de la misma.
2. Determine una variable continua, una discreta y una cualitativa. Se debe
realizar una descripción clara de cada una de las variables elegidas y la
metodología utilizada para la recolección de la información.

Diócesis de Granada en Colombia


Sede: San Francisco
Grado: 1,2,3,4,5
Continua Discreta Cualitativa
1. ¿Cuál es 2. ¿Cuántas personas 3. ¿En qué vereda
su peso? viven en casa? vive?
32,2 2 1 EL DELIRIO 1
34,9 3 2 GUACAMAYAS 2
25,2 4 3 BONANZA 1 3
22,8 5 4 BONANZA 2 4
27,5 3 1
21,5 4 1
48,1 2 3
46,6 5 1
42,1 3 3
24,7 5 4
35,4 4 2
39 2 3
20,9 3 3
31,5 5 4
45 4 1
41,1 2 1
47,8 3 2
34,9 2 3
37,8 2 1
32,3 5 2
36,6 4 3
45,6 2 1
28,1 3 3
26 5 1
44,8 4 2
24,7 4 1
45,1 4 3
38,8 2 4
44,3 3 4
47,7 2 3
3. . Se debe presentar evidencia fotográfica en el informe que brinde una
contextualización del entorno donde se realizó la investigación y donde aparezca el
estudiante recolectando los datos.

APLICACION DE APLICACION DE
ENCUESTAS ENCUESTAS

APLICACION DE APLICACION DE
ENCUESTAS ENCUESTAS

APLICACION DE ENCUESTA
Etapa 2
8. Acceder a la carpeta:

https://drive.google.com/drive/folders/1J3810Qpzvu_cxBEe91yK5nqZg2-VcR4W?
usp=sharing visualizar el tutorial: “Fase 2 Tutorial instalación programa R”, que les
explicará la instalación y ejecución del Programa R.
9. Descargar el archivo ejecutable “R-4.0.2-win.exe” e instalarlo en su computador, de
acuerdo con las indicaciones dadas en el tutorial anterior. Si por alguna razón no logran
descargar o instalar el programa R o si el sistema operativo de su computador no es
Windows, debe dirigirse a la página https://cran.r-project.org/ y descargar allí el indicado
para su sistema operativo (Linux o Mac). Tenga presente que, una vez instalado el
programa, si el sistema operativo de su computador es de 32 bits, deberá ejecutar “R i386”
y si es de 64 bits, ejecutar “R x64”.
10. Visualizar el tutorial “Fase 2 Tutorial Comandos” que explicará algunos comandos
básicos del programa R.
11. Si lo desea, también puede ir a la página https://rstudio.com/products/rstudio/download/
en donde podrá descargar el programa R Studio, el cual se instala sobre el programa R y le
confiere una interfaz más amigable para trabajar.
12. Descargar los archivos “Script Fase 4 - Proyecto aplicado.txt” y “Practico.csv”,
guárdelos en una carpeta denominada “Estadística Descriptiva”. Es importante que ambos
archivos queden en la misma carpeta.
R version 4.0.2 (2020-06-22) -- "Taking Off Again"

Copyright (C) 2020 The R Foundation for Statistical Computing

Platform: x86_64-w64-mingw32/x64 (64-bit)

R es un software libre y viene sin GARANTIA ALGUNA.

Usted puede redistribuirlo bajo ciertas circunstancias.

Escriba 'license()' o 'licence()' para detalles de distribucion.


R es un proyecto colaborativo con muchos contribuyentes.

Escriba 'contributors()' para obtener más información y

'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,

o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.

Escriba 'q()' para salir de R.

> # CODIGO R PARA LA FASE CUATRO DEL CURSO ESTADÍSTICA DESCRIPTIVA (300046A_951)

>

> # PARA EJECUTAR, DIGITAR "CONTROL+R" EN CADA LÍNEA, DE ARRIBA HACIA ABAJO

>

>

> # VARIABLE CUANTITATIVA CONTINUA

>

> # Ejemplos: peso (de animales, de cosechas, etc.), contenidos de nutrientes en el suelo (ppm),
pH, edad, material particulado, etc.

> # En el siguiente renglón reemplace y digite los 30 datos de su variable CONTINUA, separándolos
con comas. Para números decimales use punto:

>

> getwd()

[1] "C:/Users/DELTA_LAP02/Downloads/ESTADISTICA DESCRIPTIVA"

>

> # Debe aparecer la carpeta "Estadistica descriptiva" donde guardaron los archivos "Script Fase 4-
proyecto aplicado.txt" y "Practico.csv"

> # Si no les aparece la carpeta, el programa R no va a encontrar la base de datos y R mostrará un


mensaje de error al intentar abrirla

>

> PROBA=read.table("Practico.csv",header=T,sep=";",dec=",")

> attach(PROBA)
> attach(PROBA) # Muestra los nombres de las variables sobre los cuales R va a hacer los
cálculos

The following objects are masked from PROBA (pos = 3):

continua, cualitativa, discreta

>

> # Si el programa logró leer la hoja de cálculo "Practico.csv, con el siguiente comando le debe
aparecer:

>

> View(PROBA)

> # Ciérrela y continúe ejecutando el código

> CONTINUA=continua

>

> # RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO

>

> summary(CONTINUA)# Resumen estadístico

Min. 1st Qu. Median Mean 3rd Qu. Max.

1.200 3.000 3.000 3.074 3.200 4.800

> mean(CONTINUA)#media aritmética

[1] 3.074

> var(CONTINUA)#varianza

[1] 0.6297184

> sd(CONTINUA)#desviación estándar

[1] 0.793548

> min(CONTINUA) #Mínimo

[1] 1.2

> max(CONTINUA)# Máximo

[1] 4.8

> range(CONTINUA) #Rango


[1] 1.2 4.8

> median(CONTINUA)# Mediana

[1] 3

> length(CONTINUA)# Número de datos

[1] 50

> quantile(CONTINUA, 0.25)# Cuantil Q1

25%

> quantile(CONTINUA, 0.5)# Cuantil Q2 que es la mimsa mediana

50%

> quantile(CONTINUA, 0.75)# Cuantil Q3

75%

3.2

> IQR(CONTINUA) #Rango intercuartílico

[1] 0.2

> sort(CONTINUA)# Ordenar

[1] 1.2 1.2 1.2 1.4 1.5 2.4 2.5 2.9 2.9 2.9 3.0 3.0 3.0 3.0 3.0 3.0 3.0 3.0 3.0

[20] 3.0 3.0 3.0 3.0 3.0 3.0 3.0 3.0 3.0 3.1 3.1 3.1 3.1 3.1 3.1 3.1 3.1 3.2 3.2

[39] 3.2 3.3 3.4 3.6 4.2 4.2 4.2 4.3 4.3 4.4 4.5 4.8

>

> # TABLA DE FRECUENCIAS (HISTOGRAMA)PARA VARIABLE CONTINUA, CON REGLA DE STURGES

> # La regla de Sturges define el número de rangos para organizar la tabla de frecuencias:

>

> range(CONTINUA,na.rm=TRUE) # incluimos na.rm=TRUE para que ignore la presencia de valores


perdidos

[1] 1.2 4.8

> nclass.Sturges(CONTINUA)# Define el número de intervalos para presentar la frecuencia de la


variable (en este caso, 6 intervalos)

[1] 7
> seq(min(CONTINUA),max(CONTINUA),length=nclass.Sturges(CONTINUA)) # Límites de los
intervalos

[1] 1.2 1.8 2.4 3.0 3.6 4.2 4.8

> puntos=min(CONTINUA)+(0:nclass.Sturges(CONTINUA))*(max(CONTINUA)-
min(CONTINUA))/nclass.Sturges(CONTINUA)

>

> hist(CONTINUA, breaks=puntos,xlab="Intervalos",ylab="Frecuencia",main="PERIODO 951 -


Histograma CONTINUA con regla de Sturges") # histograma de frecuencias usando la regla de
Sturges

>

>

> # Instalación de la libreria agrícolae (permite el uso de otras herramientas estadísticas):

> # En "Secure CRAN mirrors", seleccionar el primero de la lista: "0-cloud [https]"

> #Tener paciencia, ya que la instalación puede tomar varios minutos

> #Esperar hasta que el cursor (> |)vuelva a estar en color rojo en la parte inferior de la consola R

>

> install.packages("agricolae")

--- Please select a CRAN mirror for use in this session ---

probando la URL 'https://cloud.r-project.org/bin/windows/contrib/4.0/agricolae_1.3-3.zip'

Content type 'application/zip' length 1292174 bytes (1.2 MB)

downloaded 1.2 MB

package ‘agricolae’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in

C:\Users\DELTA_LAP02\AppData\Local\Temp\RtmpKokGD6\downloaded_packages

>

> library(agricolae) # si la libreria se instaló correctamente, al dar CONTROL+R se pone Rojo

Warning message:

package ‘agricolae’ was built under R version 4.0.5


>

> # TABLAS DE FRECUENCIAS SIN REGLA DE STURGES:

> # Existen dos comandos que generan la misma tabla de frecuencia o histograma:

>

> # Gráficos de tabla de frecuencia:

>

> hist(CONTINUA,xlab="Intervalos",ylab="Frecuencia",main="PERIODO 951 - Histograma variable


CONTINUA")#Histograma

>

> # Gráfico de diagrama de cajas o Boxplot (organiza los datos en los cuatro cuartiles):

>

> boxplot(CONTINUA,ylab="unidad de medida",main="PERIODO 951 - Boxplot variable


CONTINUA")#Gráficos de cajas

>

> boxplot(CONTINUA,ylab="unidad de medida",main="PERIODO 951 - Boxplot variable


CONTINUA")#Gráficos de cajas

>

>

> # VARIABLE CUANTITATIVA DISCRETA

>

> # Son variables de conteo, como número de personas que habitan un predio, número de crías
por parto, número de frutos por cosecha, etc.

>

> # En el siguiente renglón, reemplace y digite los 30 datos de su variable DISCRETA, separándolos
con comas:

>

> DISCRETA=discreta

>

> # RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO

>

> summary(DISCRETA) # Resumen estadístico


Min. 1st Qu. Median Mean 3rd Qu. Max.

1.0 3.0 4.0 3.6 5.0 6.0

> min(DISCRETA) # Mínimo

[1] 1

> max(DISCRETA) # Máximo

[1] 6

> range(DISCRETA) # Rango

[1] 1 6

> mean(DISCRETA) # Media aritmética

[1] 3.6

> median(DISCRETA) # Mediana

[1] 4

> length(DISCRETA) # Número de datos

[1] 50

> sd(DISCRETA) # Desviación standar

[1] 1.428571

> quantile(DISCRETA, 0.25) # Cuantil Q1

25%

> quantile(DISCRETA, 0.5) # Cuantil Q2 que es la mimsa mediana

50%

> quantile(DISCRETA, 0.75) # Cuantil Q3

75%

> IQR(DISCRETA) # Rango intercuartílico

[1] 2

> sort(DISCRETA) # Ordenar

[1] 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5
[39] 5 5 5 5 5 5 5 5 6 6 6 6

>

> # Para las variables discretas, las tabla de frecuencias se desarrollan por pasos:

>

> FrAbsDiscreta=table(DISCRETA) # Se le asigna el nombre de "FrAbsDiscreta" para la Tabla de


frecuencias absolutas de la variable discreta

>

> FrAbsAcumDiscreta<-as.table(cumsum(FrAbsDiscreta))# Se le asigna el nombre de


"FrAbsAcumDiscreta" para la Tabla de frecuencias absolutas acumuladas de la variable discreta

> FrAbsAcumDiscreta #Frecuencias absolutas acumuladas

1 2 3 4 5 6

5 12 21 36 46 50

> FrRelDiscreta=prop.table(table(DISCRETA))# Se le asigna el nombre de "FrRelDiscreta" para la


Tabla de frecuencias relativas de la variable discreta

> FrRelDiscreta # La frecuencia relativa se da en porcentaje, acá se presenta de 0 a 1 y para


pasarla a porcentaje se multiplica por 100

DISCRETA

1 2 3 4 5 6

0.10 0.14 0.18 0.30 0.20 0.08

> FrRelAcumDiscreta<-as.table(cumsum(FrRelDiscreta)) #Frecuencias relativas acumuladas

> FrRelAcumDiscreta # Para pasar a porcentaje, se debe multiplicar por 100

1 2 3 4 5 6

0.10 0.24 0.42 0.72 0.92 1.00

>

> # GRÁFICOS DE TABLA DE FRECUENCIAS (DIAGRAMA DE BARRAS)PARA VARIABLE DISCRETA:

>

> barplot(FrAbsDiscreta,ylab="Frecuencias Absolutas",main="PERIODO 951 - Diagrama de barras


Frecuencia Absoluta DISCRETA")

> barplot(FrRelDiscreta,ylab="Frecuencia Relativa",main="PERIODO 951 - Diagrama de barras


Frecuencia Relativa DISCRETA")
> barplot(FrAbsAcumDiscreta,ylab="Frecuencia Absoluta Acumulada",main="PERIODO 951 -
Diagrama de barras Frecuencia Absoluta Acumulada DISCRETA")

> barplot(FrRelAcumDiscreta,ylab="Frecuencia Relativa Acumulada",main="PERIODO 951 -


Diagrama de barras Frecuencia Relativa Acumulada DISCRETA")

>

> # Gráfico de diagrama de cajas o Boxplot para variables discretas (organiza los datos en los
cuatro cuartiles):

>

> boxplot(DISCRETA,ylab="unidad de medida",main="PERIODO 951 - Boxplot DISCRETA")

>

> # GRÁFICO DE TORTA PARA VARIABLE DISCRETA:

>

> pie(FrAbsDiscreta,col=rainbow(6),main=c("PERIODO 951 - Grafico de tarta Frecuencia Absoluta


DISCRETA")) # Gráfico de tarta

>

>

>

> # VARIABLE CUALITATIVA O CATEGÓRICA

>

> # Son atributos no numéricos, como el nivel de estudios de una persona, el nivel de ingreso, o el
grado de ataque de un patógeno.

> # Para poder analizarlos es necesario codificarlos

> # Por ejemplo, si se hace una encuesta del nivel de estudio que tienen los agricultores de un
municipio, se pueden asignar cuatro niveles:

> # 1= sin estudio, 2= primaria, 3= secundaria y 4= universidad

> # CATEGORICA = Nivel de estudio de agricultores

>

> # En el siguiente renglón, reemplace y digite los 30 datos de su variable CUALITATIVA o


CATEGÓRICA, separándolos con comas:

>

> CATEGORICA=cualitativa
>

> # Es necesario aclararle al programa que cada número es una categoría:

>

> # En el siguiente comando reemplace de acuerdo al número de niveles que tenga su variable
categórica:

>

>

> CATEGORICA=factor(CATEGORICA, levels=c(1,2,3),

+ # A continuación, indique el nombre de cada categoría:

+ # reemplace las palabras entre comillas, indicando el nombre de cada nivel de su variable:

+ labels=c("Primaria","Secundaria","Universidad"))

>

> CATEGORICA # Muestra cada dato con el nombre del nivel de la categoría que se asignó
previamente

[1] <NA> Primaria Secundaria <NA> Universidad Secundaria

[7] Primaria Secundaria Universidad Primaria Secundaria Primaria

[13] Secundaria Universidad <NA> Secundaria Primaria Universidad

[19] <NA> Secundaria Primaria Universidad Secundaria <NA>

[25] Secundaria Primaria Secundaria Universidad <NA> Universidad

[31] Secundaria Primaria Universidad <NA> Secundaria Primaria

[37] Secundaria Universidad <NA> Secundaria Primaria Secundaria

[43] Universidad <NA> Secundaria Primaria Universidad Secundaria

[49] Primaria <NA>

Levels: Primaria Secundaria Universidad

>

> summary(CATEGORICA) # Hace un resumen del número de individuos que pertenecen a cada
una de las categorías asignadas

Primaria Secundaria Universidad NA's


12 17 11 10

> table(CATEGORICA) #Tabla de frecuencias absolutas

CATEGORICA

Primaria Secundaria Universidad

12 17 11

>

> # Al asignar nombres a los comandos, no se deben repetir los que se usaron previamente:

>

> FrAbsCategorica=table(CATEGORICA) # Se le asigna el nombre de "FrAbsCategorica" para la


Tabla de frecuencia absoluta de la variable categórica o cualitativa

> FrAbsCategorica # Presenta la tabla de frecuencia absoluta de la variable categórica

CATEGORICA

Primaria Secundaria Universidad

12 17 11

> FrRelCategorica=prop.table(table(CATEGORICA))# Se le asigna el nombre de "FrRelCategorica"


para la Tabla de frecuencia relativa de la variable categorica o cualitativa

> FrRelCategorica # Indica la frecuencia de cada nivel en términos de porcentaje (multiplicar por
100)

CATEGORICA

Primaria Secundaria Universidad

0.300 0.425 0.275

>

> # GRÁFICOS DE VARIABLES CUALITATIVAS:

> barplot(FrAbsCategorica,ylab="Frecuencias absolutas",main="PERIODO 951 - Diagrama de Barras


Frecuencia Absoluta CATEGORICA") # Diagrama de barras (frecuencia absoluta) para cada nivel de
estudios

> barplot(FrRelCategorica,ylab="Frecuencias relativas",main="PERIODO 951 - Diagrama de barras


Frecuencia Relativa CATEGORICA") # Diagrama de barras (frecuencia relativa) para cada nivel de
estudios

>

> #Diseñado por: Luis Alberto Cáceres - Director de curso


>

> mean(CONTINUA)#media aritmética

[1] 3.074

> var(CONTINUA)#varianza

[1] 0.6297184

> sd(CONTINUA)#desviación estándar

[1] 0.793548

> min(CONTINUA) #Mínimo

[1] 1.2

> max(CONTINUA)# Máximo

[1] 4.8

> range(CONTINUA) #Rango

[1] 1.2 4.8

> median(CONTINUA)# Mediana

[1] 3

> length(CONTINUA)# Número de datos

[1] 50

> quantile(CONTINUA, 0.25)# Cuantil Q1

25%

> quantile(CONTINUA, 0.5)# Cuantil Q2 que es la misma mediana

50%

> quantile(CONTINUA, 0.75)# Cuantil Q3

75%

3.2

> IQR(CONTINUA) #Rango intercuartílico

[1] 0.2

> IQR(CONTINUA) #Rango intercuartílico


Conclusiones
Después de realizar la encuesta se denota que las 30 personas a las que se le hizo la encuesta
viven distribuidas en las 4 veredas, y de igual manera es su peso y la cantidad de personas que
habitan en casa.
REFERENCIAS BIBLIOGRAFICAS
• Copia de los resultados obtenidos al ejecutar el script en la consola de resultados del
programa R (R console, seleccionar todo el texto y pegarlo al final del documento, no se
aceptan pantallazos).

R version 4.0.2 (2020-06-22) -- "Taking Off Again"

Copyright (C) 2020 The R Foundation for Statistical Computing

Platform: x86_64-w64-mingw32/x64 (64-bit)

R es un software libre y viene sin GARANTIA ALGUNA.

Usted puede redistribuirlo bajo ciertas circunstancias.

Escriba 'license()' o 'licence()' para detalles de distribucion.

R es un proyecto colaborativo con muchos contribuyentes.

Escriba 'contributors()' para obtener más información y

'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,

o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.

Escriba 'q()' para salir de R.

> # CODIGO R PARA LA FASE CUATRO DEL CURSO ESTADÍSTICA DESCRIPTIVA (300046A_951)

>

> # PARA EJECUTAR, DIGITAR "CONTROL+R" EN CADA LÍNEA, DE ARRIBA HACIA ABAJO

>

>

> # VARIABLE CUANTITATIVA CONTINUA

>

> # Ejemplos: peso (de animales, de cosechas, etc.), contenidos de nutrientes en el suelo (ppm),
pH, edad, material particulado, etc.
> # En el siguiente renglón reemplace y digite los 30 datos de su variable CONTINUA, separándolos
con comas. Para números decimales use punto:

>

> getwd()

[1] "C:/Users/DELTA_LAP02/Downloads/ESTADISTICA DESCRIPTIVA"

>

> # Debe aparecer la carpeta "Estadistica descriptiva" donde guardaron los archivos "Script Fase 4-
proyecto aplicado.txt" y "Practico.csv"

> # Si no les aparece la carpeta, el programa R no va a encontrar la base de datos y R mostrará un


mensaje de error al intentar abrirla

>

> PROBA=read.table("Practico.csv",header=T,sep=";",dec=",")

> attach(PROBA)

> attach(PROBA) # Muestra los nombres de las variables sobre los cuales R va a hacer los
cálculos

The following objects are masked from PROBA (pos = 3):

continua, cualitativa, discreta

>

> # Si el programa logró leer la hoja de cálculo "Practico.csv, con el siguiente comando le debe
aparecer:

>

> View(PROBA)

> # Ciérrela y continúe ejecutando el código

> CONTINUA=continua

>

> # RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO

>

> summary(CONTINUA)# Resumen estadístico

Min. 1st Qu. Median Mean 3rd Qu. Max.


1.200 3.000 3.000 3.074 3.200 4.800

> mean(CONTINUA)#media aritmética

[1] 3.074

> var(CONTINUA)#varianza

[1] 0.6297184

> sd(CONTINUA)#desviación estándar

[1] 0.793548

> min(CONTINUA) #Mínimo

[1] 1.2

> max(CONTINUA)# Máximo

[1] 4.8

> range(CONTINUA) #Rango

[1] 1.2 4.8

> median(CONTINUA)# Mediana

[1] 3

> length(CONTINUA)# Número de datos

[1] 50

> quantile(CONTINUA, 0.25)# Cuantil Q1

25%

> quantile(CONTINUA, 0.5)# Cuantil Q2 que es la mimsa mediana

50%

> quantile(CONTINUA, 0.75)# Cuantil Q3

75%

3.2

> IQR(CONTINUA) #Rango intercuartílico

[1] 0.2

> sort(CONTINUA)# Ordenar


[1] 1.2 1.2 1.2 1.4 1.5 2.4 2.5 2.9 2.9 2.9 3.0 3.0 3.0 3.0 3.0 3.0 3.0 3.0 3.0

[20] 3.0 3.0 3.0 3.0 3.0 3.0 3.0 3.0 3.0 3.1 3.1 3.1 3.1 3.1 3.1 3.1 3.1 3.2 3.2

[39] 3.2 3.3 3.4 3.6 4.2 4.2 4.2 4.3 4.3 4.4 4.5 4.8

>

> # TABLA DE FRECUENCIAS (HISTOGRAMA)PARA VARIABLE CONTINUA, CON REGLA DE STURGES

> # La regla de Sturges define el número de rangos para organizar la tabla de frecuencias:

>

> range(CONTINUA,na.rm=TRUE) # incluimos na.rm=TRUE para que ignore la presencia de valores


perdidos

[1] 1.2 4.8

> nclass.Sturges(CONTINUA)# Define el número de intervalos para presentar la frecuencia de la


variable (en este caso, 6 intervalos)

[1] 7

> seq(min(CONTINUA),max(CONTINUA),length=nclass.Sturges(CONTINUA)) # Límites de los


intervalos

[1] 1.2 1.8 2.4 3.0 3.6 4.2 4.8

> puntos=min(CONTINUA)+(0:nclass.Sturges(CONTINUA))*(max(CONTINUA)-
min(CONTINUA))/nclass.Sturges(CONTINUA)

>

> hist(CONTINUA, breaks=puntos,xlab="Intervalos",ylab="Frecuencia",main="PERIODO 951 -


Histograma CONTINUA con regla de Sturges") # histograma de frecuencias usando la regla de
Sturges

>

>

> # Instalación de la libreria agrícolae (permite el uso de otras herramientas estadísticas):

> # En "Secure CRAN mirrors", seleccionar el primero de la lista: "0-cloud [https]"

> #Tener paciencia, ya que la instalación puede tomar varios minutos

> #Esperar hasta que el cursor (> |)vuelva a estar en color rojo en la parte inferior de la consola R

>

> install.packages("agricolae")

--- Please select a CRAN mirror for use in this session ---
probando la URL 'https://cloud.r-project.org/bin/windows/contrib/4.0/agricolae_1.3-3.zip'

Content type 'application/zip' length 1292174 bytes (1.2 MB)

downloaded 1.2 MB

package ‘agricolae’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in

C:\Users\DELTA_LAP02\AppData\Local\Temp\RtmpKokGD6\downloaded_packages

>

> library(agricolae) # si la libreria se instaló correctamente, al dar CONTROL+R se pone Rojo

Warning message:

package ‘agricolae’ was built under R version 4.0.5

>

> # TABLAS DE FRECUENCIAS SIN REGLA DE STURGES:

> # Existen dos comandos que generan la misma tabla de frecuencia o histograma:

>

> # Gráficos de tabla de frecuencia:

>

> hist(CONTINUA,xlab="Intervalos",ylab="Frecuencia",main="PERIODO 951 - Histograma variable


CONTINUA")#Histograma

>

> # Gráfico de diagrama de cajas o Boxplot (organiza los datos en los cuatro cuartiles):

>

> boxplot(CONTINUA,ylab="unidad de medida",main="PERIODO 951 - Boxplot variable


CONTINUA")#Gráficos de cajas

>

> boxplot(CONTINUA,ylab="unidad de medida",main="PERIODO 951 - Boxplot variable


CONTINUA")#Gráficos de cajas

>

>
> # VARIABLE CUANTITATIVA DISCRETA

>

> # Son variables de conteo, como número de personas que habitan un predio, número de crías
por parto, número de frutos por cosecha, etc.

>

> # En el siguiente renglón, reemplace y digite los 30 datos de su variable DISCRETA, separándolos
con comas:

>

> DISCRETA=discreta

>

> # RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO

>

> summary(DISCRETA) # Resumen estadístico

Min. 1st Qu. Median Mean 3rd Qu. Max.

1.0 3.0 4.0 3.6 5.0 6.0

> min(DISCRETA) # Mínimo

[1] 1

> max(DISCRETA) # Máximo

[1] 6

> range(DISCRETA) # Rango

[1] 1 6

> mean(DISCRETA) # Media aritmética

[1] 3.6

> median(DISCRETA) # Mediana

[1] 4

> length(DISCRETA) # Número de datos

[1] 50

> sd(DISCRETA) # Desviación standar

[1] 1.428571

> quantile(DISCRETA, 0.25) # Cuantil Q1


25%

> quantile(DISCRETA, 0.5) # Cuantil Q2 que es la mimsa mediana

50%

> quantile(DISCRETA, 0.75) # Cuantil Q3

75%

> IQR(DISCRETA) # Rango intercuartílico

[1] 2

> sort(DISCRETA) # Ordenar

[1] 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5

[39] 5 5 5 5 5 5 5 5 6 6 6 6

>

> # Para las variables discretas, las tabla de frecuencias se desarrollan por pasos:

>

> FrAbsDiscreta=table(DISCRETA) # Se le asigna el nombre de "FrAbsDiscreta" para la Tabla de


frecuencias absolutas de la variable discreta

>

> FrAbsAcumDiscreta<-as.table(cumsum(FrAbsDiscreta))# Se le asigna el nombre de


"FrAbsAcumDiscreta" para la Tabla de frecuencias absolutas acumuladas de la variable discreta

> FrAbsAcumDiscreta #Frecuencias absolutas acumuladas

1 2 3 4 5 6

5 12 21 36 46 50

> FrRelDiscreta=prop.table(table(DISCRETA))# Se le asigna el nombre de "FrRelDiscreta" para la


Tabla de frecuencias relativas de la variable discreta

> FrRelDiscreta # La frecuencia relativa se da en porcentaje, acá se presenta de 0 a 1 y para


pasarla a porcentaje se multiplica por 100

DISCRETA

1 2 3 4 5 6
0.10 0.14 0.18 0.30 0.20 0.08

> FrRelAcumDiscreta<-as.table(cumsum(FrRelDiscreta)) #Frecuencias relativas acumuladas

> FrRelAcumDiscreta # Para pasar a porcentaje, se debe multiplicar por 100

1 2 3 4 5 6

0.10 0.24 0.42 0.72 0.92 1.00

>

> # GRÁFICOS DE TABLA DE FRECUENCIAS (DIAGRAMA DE BARRAS)PARA VARIABLE DISCRETA:

>

> barplot(FrAbsDiscreta,ylab="Frecuencias Absolutas",main="PERIODO 951 - Diagrama de barras


Frecuencia Absoluta DISCRETA")

> barplot(FrRelDiscreta,ylab="Frecuencia Relativa",main="PERIODO 951 - Diagrama de barras


Frecuencia Relativa DISCRETA")

> barplot(FrAbsAcumDiscreta,ylab="Frecuencia Absoluta Acumulada",main="PERIODO 951 -


Diagrama de barras Frecuencia Absoluta Acumulada DISCRETA")

> barplot(FrRelAcumDiscreta,ylab="Frecuencia Relativa Acumulada",main="PERIODO 951 -


Diagrama de barras Frecuencia Relativa Acumulada DISCRETA")

>

> # Gráfico de diagrama de cajas o Boxplot para variables discretas (organiza los datos en los
cuatro cuartiles):

>

> boxplot(DISCRETA,ylab="unidad de medida",main="PERIODO 951 - Boxplot DISCRETA")

>

> # GRÁFICO DE TORTA PARA VARIABLE DISCRETA:

>

> pie(FrAbsDiscreta,col=rainbow(6),main=c("PERIODO 951 - Grafico de tarta Frecuencia Absoluta


DISCRETA")) # Gráfico de tarta

>

>

>

> # VARIABLE CUALITATIVA O CATEGÓRICA

>
> # Son atributos no numéricos, como el nivel de estudios de una persona, el nivel de ingreso, o el
grado de ataque de un patógeno.

> # Para poder analizarlos es necesario codificarlos

> # Por ejemplo, si se hace una encuesta del nivel de estudio que tienen los agricultores de un
municipio, se pueden asignar cuatro niveles:

> # 1= sin estudio, 2= primaria, 3= secundaria y 4= universidad

> # CATEGORICA = Nivel de estudio de agricultores

>

> # En el siguiente renglón, reemplace y digite los 30 datos de su variable CUALITATIVA o


CATEGÓRICA, separándolos con comas:

>

> CATEGORICA=cualitativa

>

> # Es necesario aclararle al programa que cada número es una categoría:

>

> # En el siguiente comando reemplace de acuerdo al número de niveles que tenga su variable
categórica:

>

>

> CATEGORICA=factor(CATEGORICA, levels=c(1,2,3),

+ # A continuación, indique el nombre de cada categoría:

+ # reemplace las palabras entre comillas, indicando el nombre de cada nivel de su variable:

+ labels=c("Primaria","Secundaria","Universidad"))

>

> CATEGORICA # Muestra cada dato con el nombre del nivel de la categoría que se asignó
previamente

[1] <NA> Primaria Secundaria <NA> Universidad Secundaria

[7] Primaria Secundaria Universidad Primaria Secundaria Primaria

[13] Secundaria Universidad <NA> Secundaria Primaria Universidad


[19] <NA> Secundaria Primaria Universidad Secundaria <NA>

[25] Secundaria Primaria Secundaria Universidad <NA> Universidad

[31] Secundaria Primaria Universidad <NA> Secundaria Primaria

[37] Secundaria Universidad <NA> Secundaria Primaria Secundaria

[43] Universidad <NA> Secundaria Primaria Universidad Secundaria

[49] Primaria <NA>

Levels: Primaria Secundaria Universidad

>

> summary(CATEGORICA) # Hace un resumen del número de individuos que pertenecen a cada
una de las categorías asignadas

Primaria Secundaria Universidad NA's

12 17 11 10

> table(CATEGORICA) #Tabla de frecuencias absolutas

CATEGORICA

Primaria Secundaria Universidad

12 17 11

>

> # Al asignar nombres a los comandos, no se deben repetir los que se usaron previamente:

>

> FrAbsCategorica=table(CATEGORICA) # Se le asigna el nombre de "FrAbsCategorica" para la


Tabla de frecuencia absoluta de la variable categórica o cualitativa

> FrAbsCategorica # Presenta la tabla de frecuencia absoluta de la variable categórica

CATEGORICA

Primaria Secundaria Universidad

12 17 11

> FrRelCategorica=prop.table(table(CATEGORICA))# Se le asigna el nombre de "FrRelCategorica"


para la Tabla de frecuencia relativa de la variable categorica o cualitativa

> FrRelCategorica # Indica la frecuencia de cada nivel en términos de porcentaje (multiplicar por
100)

CATEGORICA
Primaria Secundaria Universidad

0.300 0.425 0.275

>

> # GRÁFICOS DE VARIABLES CUALITATIVAS:

> barplot(FrAbsCategorica,ylab="Frecuencias absolutas",main="PERIODO 951 - Diagrama de Barras


Frecuencia Absoluta CATEGORICA") # Diagrama de barras (frecuencia absoluta) para cada nivel de
estudios

> barplot(FrRelCategorica,ylab="Frecuencias relativas",main="PERIODO 951 - Diagrama de barras


Frecuencia Relativa CATEGORICA") # Diagrama de barras (frecuencia relativa) para cada nivel de
estudios

>

> #Diseñado por: Luis Alberto Cáceres - Director de curso

>

> mean(CONTINUA)#media aritmética

[1] 3.074

> var(CONTINUA)#varianza

[1] 0.6297184

> sd(CONTINUA)#desviación estándar

[1] 0.793548

> min(CONTINUA) #Mínimo

[1] 1.2

> max(CONTINUA)# Máximo

[1] 4.8

> range(CONTINUA) #Rango

[1] 1.2 4.8

> median(CONTINUA)# Mediana

[1] 3

> length(CONTINUA)# Número de datos

[1] 50

> quantile(CONTINUA, 0.25)# Cuantil Q1


25%

> quantile(CONTINUA, 0.5)# Cuantil Q2 que es la misma mediana

50%

> quantile(CONTINUA, 0.75)# Cuantil Q3

75%

3.2

> IQR(CONTINUA) #Rango intercuartílico

[1] 0.2

> IQR(CONTINUA) #Rango intercuartílico

[1] 0.2

> IQR(CONTINUA) #Rango intercuartílico

[1] 0.2

>

También podría gustarte