Está en la página 1de 26

ESTADÍSTICA DESCRIPTIVA

FASE 4 Proyecto con procesamiento estadístico.

Realizado por:
YENIDFER PARRA RAMÍREZ
CÓDIGO 1.119.585.143

Tutor
MANUEL TORRES

UNIVERSIDAD NACIONAL ABIERTA


Y A DISTANCIA UNAD
AGRONOMÍA
2020
INTRODUCCIÓN

En este ejercicio implementaremos de forma práctica los conceptos que hemos venido
trabajando en la unidad 1 y 2 aplicándolos en una base de datos real y procesados en el
programa R buscando un mejor manejo y practica de las diferentes herramientas estadísticas
que se pueden emplear en el ámbito profesional y en diferentes actividades.
OBJETIVOS

 Aplicar los conceptos estadísticos a un proyecto agropecuario


 Implementar y desarrollar la base de datos en el programa R realizando las tablas de
frecuencia y las gráficas de las diferentes variables
 Observar las gráficas y los datos obtenidos con la variable continua, discreta y
cualitativa, para poder darle una interpretación y análisis.
Proyecto con procesamiento estadístico.
Etapa 1.

El área de trabajo se encuentra localizado en el municipio de la montañita Caquetá,


en la vereda Alto Rio chiquito, latitud: 1°40'48.79" longitud -75°22'50.85"

Con el apoyo del señor Jovani Cendales dueño de la finca EL JORDÁN quien luego
de explicarle de que se trataba la actividad amablemente me facilito la información
que se necesita recolectar, peso de los bovinos, producción de leche diaria, número
de trabajadores y grado de escolaridad.

Cabe aclarar que debido a la contingencia por la cual estamos atravesando y las
medidas de restricción dadas en la ciudad fue imposible movilizarme hasta el lugar
de estudio, la comunicación con el dueño de la finca quien es un conocido se realizó
vía telefónica y el amablemente me facilito algunas fotos, resaltando que en el lugar
es algo dificultosa la señal telefónica o el internet.
NIVEL
PRODUCCIÓ
NUMERO DE PESO DE ESCOLARIDA
N DE LECHE
DATOS VACAS/KL D PERSONAL
LITROS/DIA
FINCA
295
1 6.5 1
2 200 4 2
3 300 9.3 1
4 250 6 1
5 230 5 2
6 320 4 1
7 300 8.5 2
8 312 8 3
9 325 8.6  
10 360 8  
11 275 4.5  
12 290 6  
13 400 10
14 360 8.2
15 325 9
16 289 9
17 320 7.5
18 310 9
19 257 6
20 280 5
VARIABLE CONTINUA

Histogram of CONTINUA
7
6
5
F re q u e ncy

4
3
2
1
0

200 250 300 350 400

CONTINUA

Para esta grafica el intervalo que más se corea en el peso de los bovinos está en el rango de 300
kilogramos, lo cual me indica que hay un equilibrio en el peso de los vacunos.
Boxplot CONTINUA PERIODO 763
400
350
unidad de medida

300
250
200

La grafica de Boxplot nos indica los resultados obtenidos de máximo, más o menos de 400,
mínimo 200 y mediana 300, Q1 278.75, Q2 que es la misma mediana 300
Q3 321.25
Resumen estadístico
Min. 1st Qu. Median Mean 3rd Qu. Max.
200.0 278.8 300.0 299.9 321.2 400.0
> mean(CONTINUA)#media aritmética
[1] 299.9
> var(CONTINUA)#varianza
[1] 2105.989
> sd(CONTINUA)#desviación estándar
[1] 45.89106
> min(CONTINUA) #Mínimo
[1] 200
> max(CONTINUA)# Máximo
[1] 400
> range(CONTINUA) #Rango
[1] 200 400
> median(CONTINUA)# Mediana
[1] 300
> length(CONTINUA)# Número de datos
[1] 20
> quantile(CONTINUA, 0.25)# Cuantil Q1
25%
278.75
> quantile(CONTINUA, 0.5)# Cuantil Q2 que es la mimsa mediana
50%
300
> quantile(CONTINUA, 0.75)# Cuantil Q3
75%
321.25
> IQR(CONTINUA) #Rango intercuartílico
[1] 42.5

VARIABLE CUANTITATIVA DISCRETA

Diagrama de barras PERIODO 763 Frecuencia Absoluta DISCRETA


3.0
2.5
2.0
Frecuencias Absolutas

1.5
1.0
0.5
0.0

4 4.5 5 6 6.5 8 8.2 8.6 9 9.3


Diagrama de barras PERIODO 763 Frecuencia Absoluta Acumulada DISCRETA
20
15
Frecuencia Absoluta Acumulada

10
5
0

4 4.5 5 6 6.5 8 8.2 8.6 9 9.3


DIAGRAMA DE BARRAS DE FRECUENCIA RELATIVA ACUMULADA DISCRETA

Grafico de tarta PERIODO 763 Frecuencia Absoulta DISCRETA

5
6
4.5

6.5
4
7.5

10
8
9.3

8.2
8.5 9
8.6
la gráfica de barras de frecuencia relativa acumulada discreta va en aumentando de menor a
mayor y en la gráfica de tarta de frecuencia absoluta discreta nos muestra en porcentajes de
variación en cuanto a la producción de leche, mostrándonos que esta no es estándar.

# Resumen estadístico
Min. 1st Qu. Median Mean 3rd Qu. Max.
4.000 5.750 7.750 7.105 8.700 10.000
> min(DISCRETA) # Mínimo
[1] 4
> max(DISCRETA) # Máximo
[1] 10
> range(DISCRETA) # Rango
[1] 4 10
> mean(DISCRETA) # Media aritmética
[1] 7.105
> median(DISCRETA) # Mediana
[1] 7.75
> length(DISCRETA) # Número de datos
[1] 20
> sd(DISCRETA) # Desviación standar
[1] 1.920382
> quantile(DISCRETA, 0.25) # Cuantil Q1
25%
5.75
> quantile(DISCRETA, 0.5) # Cuantil Q2 que es la mimsa mediana
50%
7.75
> quantile(DISCRETA, 0.75) # Cuantil Q3
75%
8.7
> IQR(DISCRETA)
Diagrama de Barras #PERIODO
Rango intercuartílico
763 Frecuencia Absoluta CATEGORICA
[1] 2.95
4
3
Frecuencias absolutas

2
1

VARIABLE CUALITATIVA CATEGÓRICA


0

Sin estudios Primaria Secundaria


Diagrama de barras PERIODO 763 Frecuencia Relativa CATEGORICA
0.5
0.4
Frecuencias relativas

0.3
0.2

Diagrama de frecuencia relativa categórica


0.1
0.0

Sin estudios Primaria Secundaria


En el diagrama de barras de frecuencia absoluta categórica y el diagrama de frecuencia relativa
categórica nos muestra el número de individuos en este caso trabajadores de la finca con cierto
grado de escolaridad: Sin estudios 4, Primaria 3, Secundaria 1.

CONCLUSIONES

El desarrollar este trabajo me permitió poner en práctica la teoría vista durante el curso y reforzar
los conocimientos en base al manejo del programa R, además de poder relacionar lo aprendido
en un caso real adquiriendo una base para aplicarla en la vida profesional.

REFERENCIAS BIBLIOGRÁFICAS
Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en problemas de
agronomía. Recuperado de http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?
docID=3221775&query=bioestadistica 

Mendoza, H, Bautista, G. (2002). Probabilidad y Estadística. Universidad Nacional de


Colombia, http://red.unal.edu.co/cursos/ciencias/2001065/html/un1/cont_102_02.html

# CODIGO R PARA LA FASE CUATRO DEL CURSO ESTADÍSTICA


DESCRIPTIVA (300046A_614)
>
> # PARA EJECUTAR, DIGITAR "CONTROL+R" EN CADA LÍNEA, DE ARRIBA HACIA
ABAJO
>
>
> # VARIABLE CUANTITATIVA CONTINUA
>
> # Ejemplos: peso (de animales)
> # En el siguiente renglón reemplace y digite los 30 datos de su variable
CONTINUA, separándolos con comas. Para números decimales use punto:
>
>
CONTINUA=c(295,200,300,250,230,320,300,312,325,360,275,290,400,360,325,2
89,320,310,257,280)
>
> # RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO
>
> summary(CONTINUA)# Resumen estadístico
Min. 1st Qu. Median Mean 3rd Qu. Max.
200.0 278.8 300.0 299.9 321.2 400.0
> mean(CONTINUA)#media aritmética
[1] 299.9
> var(CONTINUA)#varianza
[1] 2105.989
> sd(CONTINUA)#desviación estándar
[1] 45.89106
> min(CONTINUA) #Mínimo
[1] 200
> max(CONTINUA)# Máximo
[1] 400
> range(CONTINUA) #Rango
[1] 200 400
> median(CONTINUA)# Mediana
[1] 300
> length(CONTINUA)# Número de datos
[1] 20
> quantile(CONTINUA, 0.25)# Cuantil Q1
25%
278.75
> quantile(CONTINUA, 0.5)# Cuantil Q2 que es la mimsa mediana
50%
300
> quantile(CONTINUA, 0.75)# Cuantil Q3
75%
321.25
> IQR(CONTINUA) #Rango intercuartílico
[1] 42.5
> sort(CONTINUA)# Ordenar
[1] 200 230 250 257 275 280 289 290 295 300 300 310 312 320 320 325 325 360
360
[20] 400
>
> # TABLA DE FRECUENCIAS (HISTOGRAMA)PARA VARIABLE CONTINUA, CON
REGLA DE STURGES
> # La regla de Sturges define el número de rangos para organizar la tabla de
frecuencias:
>
> range(CONTINUA,na.rm=TRUE) # incluimos na.rm=TRUE para que ignore la
presencia de valores perdidos
[1] 200 400
> nclass.Sturges(CONTINUA)# Define el número de intervalos para presentar la
frecuencia de la variable (en este caso, 6 intervalos)
[1] 6
> seq(min(CONTINUA),max(CONTINUA),length=nclass.Sturges(CONTINUA)) #
Límites de los intervalos
[1] 200 240 280 320 360 400
>
intervalosCONTINUA=cut(CONTINUA,breaks=seq(min(CONTINUA),max(CONTINUA)
,length=nclass.Sturges(min(CONTINUA))),include.lowest=TRUE)
> intervalosCONTINUA# Se muestran los intervalos de edad, uno correspondiente a
cada edad observada
[1] (294,295] [200,201] (299,300] (249,250] (229,230] (319,320] (299,300]
[8] (311,312] (324,325] (359,360] (274,275] (289,290] (399,400] (359,360]
[15] (324,325] (288,289] (319,320] (309,310] (256,257] (279,280]
200 Levels: [200,201] (201,202] (202,203] (203,204] (204,205] ... (399,400]
> puntos=min(CONTINUA)+(0:nclass.Sturges(CONTINUA))*(max(CONTINUA)-
min(CONTINUA))/nclass.Sturges(CONTINUA)
>
> hist(CONTINUA, breaks=puntos)# histograma de frecuencias usando la regla de
Sturges
>
>
> # Instalación de la libreria agrícolae (permite el uso de otras herramientas
estadísticas):
> # En "Secure CRAN mirrors", seleccionar: "USA(IA)"
> #Tener paciencia, ya que la instalación puede tomar varios minutos
> #Esperar hasta que el cursor (> |)vuelva a estar en color rojo en la parte inferior
de la consola R
> utils:::menuInstallPkgs()
--- Please select a CRAN mirror for use in this session ---
probando la URL
'https://www.icesi.edu.co/CRAN/bin/windows/contrib/4.0/usa_0.1.0.zip'
Content type 'application/zip' length 1987350 bytes (1.9 MB)
downloaded 1.9 MB

package ‘usa’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in


C:\Users\Usuario\AppData\Local\Temp\RtmpmoPWCn\downloaded_packages
>
> install.packages("agricolae")
Installing package into ‘C:/Users/Usuario/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
probando la URL
'https://www.icesi.edu.co/CRAN/bin/windows/contrib/4.0/agricolae_1.3-3.zip'
Content type 'application/zip' length 1295018 bytes (1.2 MB)
downloaded 1.2 MB

package ‘agricolae’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in


C:\Users\Usuario\AppData\Local\Temp\RtmpmoPWCn\downloaded_packages
>
> library(agricolae) # si la libreria se instaló correctamente, al dar CONTROL+R se
pone Rojo
Warning message:
package ‘agricolae’ was built under R version 4.0.2
>
> # TABLAS DE FRECUENCIAS SIN REGLA DE STURGES:
> # Existen dos comandos que generan la misma tabla de frecuencia o histograma:
>
> # Gráficos de tabla de frecuencia:
> tbFreqCONTINUA=table.freq(hist(CONTINUA,plot=TRUE))
>
> hist(CONTINUA,ylab="Frecuencia",main="Histograma CONTINUA PERIODO
763")#Histograma
>
> # Tabla de frecuencia:
>
> tbFreqCONTINUA
Lower Upper Main Frequency Percentage CF CPF
1 200 250 225 3 15 3 15
2 250 300 275 8 40 11 55
3 300 350 325 6 30 17 85
4 350 400 375 3 15 20 100
>
> # Gráfico de diagrama de cajas o Boxplot (organiza los datos en los cuatro
cuartiles):
>
> boxplot(CONTINUA,ylab="unidad de medida",main="Boxplot CONTINUA
PERIODO 763")#Gráficos de cajas
>
>
> # VARIABLE CUANTITATIVA DISCRETA
>
> # Son variables de conteo, como número produccion de leche/dia.
>
> # En el siguiente renglón, reemplace y digite los 30 datos de su variable
DISCRETA, separándolos con comas:
>
> DISCRETA=c(6.5,4,9.3,6,5,4,8.5,8,8.6,8,4.5,6,10,8.2,9,9,7.5,9,6,5)
>
> # RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO
>
> summary(DISCRETA) # Resumen estadístico
Min. 1st Qu. Median Mean 3rd Qu. Max.
4.000 5.750 7.750 7.105 8.700 10.000
> min(DISCRETA) # Mínimo
[1] 4
> max(DISCRETA) # Máximo
[1] 10
> range(DISCRETA) # Rango
[1] 4 10
> mean(DISCRETA) # Media aritmética
[1] 7.105
> median(DISCRETA) # Mediana
[1] 7.75
> length(DISCRETA) # Número de datos
[1] 20
> sd(DISCRETA) # Desviación standar
[1] 1.920382
> quantile(DISCRETA, 0.25) # Cuantil Q1
25%
5.75
> quantile(DISCRETA, 0.5) # Cuantil Q2 que es la mimsa mediana
50%
7.75
> quantile(DISCRETA, 0.75) # Cuantil Q3
75%
8.7
> IQR(DISCRETA) # Rango intercuartílico
[1] 2.95
> sort(DISCRETA) # Ordenar
[1] 4.0 4.0 4.5 5.0 5.0 6.0 6.0 6.0 6.5 7.5 8.0 8.0 8.2 8.5 8.6
[16] 9.0 9.0 9.0 9.3 10.0
>
> # Para las variables discretas, las tabla de frecuencias se desarrollan por pasos:
>
> FrAbsDiscreta=table(DISCRETA) # Se le asigna el nombre de "FrAbsDiscreta"
para la Tabla de frecuencias absolutas de la variable discreta
>
> FrAbsAcumDiscreta<-as.table(cumsum(FrAbsDiscreta))# Se le asigna el nombre
de "FrAbsAcumDiscreta" para la Tabla de frecuencias absolutas acumuladas de la
variable discreta
> FrAbsAcumDiscreta #Frecuencias absolutas acumuladas
4 4.5 5 6 6.5 7.5 8 8.2 8.5 8.6 9 9.3 10
2 3 5 8 9 10 12 13 14 15 18 19 20
> FrRelDiscreta=prop.table(table(DISCRETA))# Se le asigna el nombre de
"FrRelDiscreta" para la Tabla de frecuencias relativas de la variable discreta
> FrRelDiscreta # La frecuencia relativa se da en porcentaje, acá se presenta de 0
a 1 y para pasarla a porcentaje se multiplica por 100
DISCRETA
4 4.5 5 6 6.5 7.5 8 8.2 8.5 8.6 9 9.3 10
0.10 0.05 0.10 0.15 0.05 0.05 0.10 0.05 0.05 0.05 0.15 0.05 0.05
> FrRelAcumDiscreta<-as.table(cumsum(FrRelDiscreta)) #Frecuencias relativas
acumuladas
> FrRelAcumDiscreta # Para pasar a porcentaje, se debe multiplicar por 100
4 4.5 5 6 6.5 7.5 8 8.2 8.5 8.6 9 9.3 10
0.10 0.15 0.25 0.40 0.45 0.50 0.60 0.65 0.70 0.75 0.90 0.95 1.00
>
> # GRÁFICOS DE TABLA DE FRECUENCIAS (DIAGRAMA DE BARRAS)PARA
VARIABLE DISCRETA:
>
> barplot(FrAbsDiscreta,ylab="Frecuencias Absolutas",main="Diagrama de barras
PERIODO 763 Frecuencia Absoluta DISCRETA")
> barplot(FrRelDiscreta,ylab="Frecuencia Relativa",main="Diagrama de barras
PERIODO 763 Frecuencia Relativa DISCRETA")
> barplot(FrAbsAcumDiscreta,ylab="Frecuencia Absoluta
Acumulada",main="Diagrama de barras PERIODO 763 Frecuencia Absoluta
Acumulada DISCRETA")
> barplot(FrRelAcumDiscreta,ylab="Frecuencia Relativa
Acumulada",main="Diagrama de barras PERIODO 763 Frecuencia Relativa
Acumulada DISCRETA")
>
> # Gráfico de diagrama de cajas o Boxplot para variables discretas (organiza los
datos en los cuatro cuartiles):
>
> boxplot(DISCRETA)
>
> # GRÁFICO DE TORTA PARA VARIABLE DISCRETA:
>
> pie(FrAbsDiscreta,col=rainbow(6),main=c("Grafico de tarta PERIODO 763
Frecuencia Absoulta DISCRETA")) # Gráfico de tarta
>
>
>
> # VARIABLE CUALITATIVA O CATEGÓRICA
>
> # Son atributos no numéricos, como el nivel de estudios de una persona.
> # Para poder analizarlos es necesario codificarlos
> # Por ejemplo, si se hace una encuesta del nivel de estudio que tienen los
agricultores de un municipio, se pueden asignar cuatro niveles:
> # 1= sin estudio, 2= primaria, 3= secundaria
> # CATEGORICA = Nivel de escolaridad trabajadores
>
> # En el siguiente renglón, reemplace y digite los 30 datos de su variable
CUALITATIVA o CATEGÓRICA, separándolos con comas:
>
> CATEGORICA=c(1,2,1,1,2,1,2,3)
>
> # Es necesario aclararle al programa que cada número es una categoría:
>
> # En el siguiente comando reemplace de acuerdo al número de niveles que tenga
su variable categórica:
>
> CATEGORICA=factor(CATEGORICA, levels=c(1,2,3),
+
+ # A continuación, indique el nombre de cada categoría:
+ # reemplace las palabras entre comillas, indicando el nombre de cada nivel de su
variable:
+
+ labels=c("Sin estudios","Primaria","Secundaria"))
>
> CATEGORICA # Muestra cada dato con el nombre del nivel de la categoría que
se asignó previamente
[1] Sin estudios Primaria Sin estudios Sin estudios Primaria
[6] Sin estudios Primaria Secundaria
Levels: Sin estudios Primaria Secundaria
>
> summary(CATEGORICA) # Hace un resumen del número de individuos que
pertenecen a cada una de las categorías asignadas
Sin estudios Primaria Secundaria
4 3 1
> table(CATEGORICA) #Tabla de frecuencias absolutas
CATEGORICA
Sin estudios Primaria Secundaria
4 3 1
>
> # Al asignar nombres a los comandos, no se deben repetir los que se usaron
previamente:
>
> FrAbsCategorica=table(CATEGORICA) # Se le asigna el nombre de
"FrAbsCategorica" para la Tabla de frecuencia absoluta de la variable categórica o
cualitativa
> FrAbsCategorica # Presenta la tabla de frecuencia absoluta de la variable
categórica
CATEGORICA
Sin estudios Primaria Secundaria
4 3 1
> FrRelCategorica=prop.table(table(CATEGORICA))# Se le asigna el nombre de
"FrRelCategorica" para la Tabla de frecuencia relativa de la variable categorica o
cualitativa
> FrRelCategorica # Indica la frecuencia de cada nivel en términos de porcentaje
(multiplicar por 100)
CATEGORICA
Sin estudios Primaria Secundaria
0.500 0.375 0.125
>
> # GRÁFICOS DE VARIABLES CUALITATIVAS:
> barplot(FrAbsCategorica,ylab="Frecuencias absolutas",main="Diagrama de
Barras PERIODO 763 Frecuencia Absoluta CATEGORICA") # Diagrama de barras
(frecuencia absoluta) para cada nivel de estudios
> barplot(FrRelCategorica,ylab="Frecuencias relativas",main="Diagrama de barras
PERIODO 763 Frecuencia Relativa CATEGORICA") # Diagrama de barras (frecuencia
relativa) para cada nivel de estudios
>
>
>

También podría gustarte