Está en la página 1de 29

Estadística descriptiva para agrarias

Fase 4 – proyecto agropecuario

Tutor: Luis Alberto Cáceres Torres

Grupo: 300046_151

Jackson David fontecha solorzano

Código:1031179572

Universidad Nacional Abierta y a Distancia. (UNAD)

Escuela de ciencias agrícolas, pecuarias y del medio ambiente. (ECAPMA)

CEAD José Acevedo y Gómez

Bogotá D.C 2020


Etapa 1
Definir el area de trabajo :

Area de trabajo lombricultivo clasificacion por peso y individuos reproductores y no

reproductivos, numero de crias de los individuos según su peso.

Etapa 2

Indicar ubicación de sitio fuente de los datos:

Los datos fueron obtenidos en la ciudad de Bogota en el barrio libertador de un

lombricultivo para la obtencion de humus y lombriz roja californiana.

Variable continua:

Clacificacion de 46 individuos por su peso, ya que se sabe que una lombriz es reproductora

despues de superar un peso de 0.24g hasta su peso maximo 1.4g por individuo pueden

llegar a tener 1300 huevecillos al año por individuo según su peso esto aproximadamente

seria 108 lombrices por mes según el peso de esta.

1= 2= 3= 4= 5= 6= 7= 8= 9= 10=
0.1 0.2 0.10 0.1 0.50 0.50 1 1.2 1.2 0.30
0 0 0
11= 12= 13= 14= 15= 16= 17= 18= 19= 20=
0.3 0.4 0.50 0.5 0.50 0.50 0.15 0.10 0.35 0.35
0 0 0
21= 22= 23= 24= 25= 26= 27= 28= 29= 30=
0.2 0.2 0.20 0.3 0.10 0.15 0.20 0.15 1.2 1.1
0 0 0
31= 32= 33= 34= 35= 36= 37= 38= 39= 40=
1 1 0.80 0.8 0.15 1.1 0.20 0.20 0.30 0.10
0
41= 42= 43= 44= 45= 46=
0.1 0.1 0.40 0.1 0.10 0.50
5 0 0

Cuadro de datos:

Media aridmertica 0.4271739

varianza 0.1285229

Desviacion estandar 0.358501

Minimo 0.10
Maximo 1.2
Rango 0.10 – 1.2

Mediana 0.30

Numero de datos 46

Cuantil 1 25% - 0.15

Cuantil 2 50% - 0.30

Cuantil 3 75% - 0.50

Rango intercuartilico 0.35


Variable discreta:

1= 6= 11= 16= 21=


20 33 48 63 30

2= 7= 12= 17= 22=


20 41 50 61 80
3= 8= 13= 18= 23=
24 46 77 80 100
4= 9= 14= 19= 24=
28 39 72 85 100

5= 10= 15= 20= 25=


37 44 70 30 95

Numero de huevecillos por individuo ya sabiendo que tenemos el peso de los indivuos

Media aridmertica 54.92 clasificamos los reproductores y se realiza un

estimado establecido por la puesta de


Desviacion estandar 25.67736
huevecillos según su peso.
Minimo 20
Maximo 100
Rango 20 – 100
Cuadro de datos:
Mediana 48.00

Numero de datos 25

Cuantil 1 25% - 33

Cuantil 2 50% - 48

Cuantil 3 75% - 77

Rango intercuartilico 44
Variable categorica:

Lombrices que son reproductoras y lombrices que no son reproductoras, las lombrices que

son reproductoras son aquellas que tiene un peso mayor a 0.24gr, las que no son

reproductoras son aquellas que pesan menos de 0.24gr.

Categorias: (1) Reproductoras (2)No Reproductoras

1=(2) 2=(2) 3=(2) 4=(2) 5=(1) 6=(1) 7=(1) 8=(1) 9=(1) 10=(1
)
0.10 0.20 0.10 0.10 0.50 0.50 1 1.2 1.2
0.30
11=(1 12=(1 13=(1 14=(1 15=(1 16=(1) 17=(2 18=(2 19=(1 20=(1
) ) ) ) ) ) ) ) )
0.50
0.30 0.40 0.50 0.50 0.50 0.15 0.10 0.35 0.35
21=(2 22=(2 23=(2 24=(1 25=(2 26=(2) 27=(2 28=(2 29=(1 30=(1
) ) ) ) ) ) ) ) )
0.15
0.20 0.20 0.20 0.30 0.10 0.20 0.15 1.2 1.1
31=(1 32=(1 33=(1 34=(1 35=(2 36=(1) 37=(2 38=(2 39=(1 40=(2
) ) ) ) ) ) ) ) )
1.1
1 1 0.80 0.80 0.15 0.20 0.20 0.30 0.10
41=(2 42=(2 43=(1 44=(2 45=(2 46=(1)
) ) ) ) )
0.50
0.15 0.10 0.40 0.10 0.10

Histograma con regla de sturges y sin la regla de sturges variable continua:


- La diferencia entre el histograma con la regla de sturges y el que no la tiene es que

en el histograma de sturges nos muestra los intervalos que hay en la investigación

además de los datos exactos y más concisos, en cambio en al histograma sin la regla

de sturges podemos apreciar que en el intervalo donde no se recopilaron datos que

es de 0.59 a 0.79 se realiza un conteo como si hubiese existencias de muestra en este

intervalo cuando en realidad no hay ninguna por esto es mejor el histograma con la

regla de sturges ya que es mas preciso y confiables y organiza los datos de una

mejor manera.

Diagrama de cajas variable continua


- En el diagrama de cajas se pueden encontrar datos importantes como lo son la

media, máxima, la varianza, además de los cuantiles el cuantil 1, el cuantil 2 que es

igual a la media, y el cuantil 3, también podemos encontrar el rango de datos es un

gráfico importante en cuanto a la interpretación de resultados.

Variable discreta:
Grafico de tabla de frecuencia absoluta y absoluta acumulada
- En el grafico de frecuencia absoluta observamos las veces que se repiten los datos

en este caso no se repite mucho ya que cada lombriz da un numero de huevecillos

muy distinto, pero se ve en aumento ya que hay unas que están en su etapa mas

adultas dando mas de 50 huevecillos por mes y las más jóvenes menos de 50 por

mes

Grafico de tabla de frecuencia relativas y relativas acumuladas


- Esta grafica representa los mismos valores que la frecuencia absoluta solo que en la

frecuencia relativa los datos se reflejan como porcentajes

Diagrama de cajas:
- Al igual que la variable continua podemos encontrar los mismos datos la media, la

máxima, los cuantiles 1 2 3, el único dato que no se encuentra en esta es la varianza, ni la

variación estándar.

Gráfico de tarta:

- En el gráfico de tarta están representados los 25 datos como apreciamos solo salen

21 datos esto es porque algunos de ellos se repiten por esta razón se ven unos

intervalos mas amplios que los otros, es un gráfico que expresa sencillamente la

frecuencia absoluta a algunos agrada mas este tipo de graficas por su sencillez
Variable cualitativa o categórica:

Gráfico de frecuencia absoluta

- La interpretación de datos en este grafico es sumamente sencillo ya que nos muestra

las dos categorías que manejamos y la cantidad de individuos o muestras que

tenemos para contemplar, que tenemos 25 lombrices que cumplen con el peso

establecido para ser reproductoras y 21 lombrices que no cumplen con el peso

establecido por lo tanto no han adquirido la madurez suficiente para ser

reproductoras
Gráfico de frecuencia relativa

- En esta grafica podemos apreciar los mismos datos de la gráfica de frecuencia

absoluta, pero en esta grafica de frecuencias relativas los datos están representados

en porcentajes de la siguiente manera un 54% de las lombrices son Reproductoras y

un 46% de las lombrices No son Reproductoras.


Project R código copiado de la aplicación con las respectivas graficas.
R version 3.5.3 (2019-03-11) -- "Great Truth"

Copyright (C) 2019 The R Foundation for Statistical Computing

Platform: x86_64-w64-mingw32/x64 (64-bit)

R es un software libre y viene sin GARANTIA ALGUNA.

Usted puede redistribuirlo bajo ciertas circunstancias.

Escriba 'license()' o 'licence()' para detalles de distribucion.

R es un proyecto colaborativo con muchos contribuyentes.

Escriba 'contributors()' para obtener más información y

'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,

o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.

Escriba 'q()' para salir de R.

> # CODIGO R PARA LA FASE CUATRO DEL CURSO ESTADÍSTICA DESCRIPTIVA (300046A_614)

> # PARA EJECUTAR, DIGITAR "CONTROL+R" EN CADA LÍNEA, DE ARRIBA HACIA ABAJO

> # VARIABLE CUANTITATIVA CONTINUA

>

> # Ejemplos: peso (de animales, de cosechas, etc.), contenidos de nutrientes en el suelo (ppm),
pH, edad, material particulado, etc.

> # En el siguiente renglón reemplace y digite los 30 datos de su variable CONTINUA, separándolos
con comas. Para números decimales use punto:

>

>
CONTINUA=c(0.10,0.20,0.10,0.10,0.5,0.5,1,1.2,1.2,0.30,0.30,0.40,0.50,0.50,0.50,0.5,0.15,0.10,0.35
,0.35,0.20,0.20,0.20,0.30,0.10,0.15,0.20,0.15,1.2,1.1,1,1,0.80,0.80,0.15,1.1,0.20,0.20,0.30,0.10,0.1
5,0.10,0.40,0.10,0.10,0.5)

>

> # RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO

>

> summary(CONTINUA)# Resumen estadístico


Min. 1st Qu. Median Mean 3rd Qu. Max.

0.1000 0.1500 0.3000 0.4272 0.5000 1.2000

> mean(CONTINUA)#media aritmética

[1] 0.4271739

> var(CONTINUA)#varianza

[1] 0.1285229

> sd(CONTINUA)#desviación estándar

[1] 0.358501

> min(CONTINUA) #Mínimo

[1] 0.1

> max(CONTINUA)# Máximo

[1] 1.2

> range(CONTINUA) #Rango

[1] 0.1 1.2

> median(CONTINUA)# Mediana

[1] 0.3

> length(CONTINUA)# Número de datos

[1] 46

> quantile(CONTINUA, 0.25)# Cuantil Q1

25%

0.15

> quantile(CONTINUA, 0.5)# Cuantil Q2 que es la mimsa mediana

50%

0.3

> quantile(CONTINUA, 0.75)# Cuantil Q3

75%

0.5

> IQR(CONTINUA) #Rango intercuartílico

[1] 0.35
> sort(CONTINUA)# Ordenar

[1] 0.10 0.10 0.10 0.10 0.10 0.10 0.10 0.10 0.10 0.15 0.15 0.15 0.15 0.15 0.20

[16] 0.20 0.20 0.20 0.20 0.20 0.20 0.30 0.30 0.30 0.30 0.35 0.35 0.40 0.40 0.50

[31] 0.50 0.50 0.50 0.50 0.50 0.50 0.80 0.80 1.00 1.00 1.00 1.10 1.10 1.20 1.20

[46] 1.20

> # TABLA DE FRECUENCIAS (HISTOGRAMA)PARA VARIABLE CONTINUA, CON REGLA DE STURGES

> # La regla de Sturges define el número de rangos para organizar la tabla de frecuencias:

> range(CONTINUA,na.rm=TRUE) # incluimos na.rm=TRUE para que ignore la presencia de valores


perdidos

[1] 0.1 1.2

> nclass.Sturges(CONTINUA)# Define el número de intervalos para presentar la frecuencia de la


variable (en este caso, 6 intervalos)

[1] 7

> seq(min(CONTINUA),max(CONTINUA),length=nclass.Sturges(CONTINUA)) # Límites de los


intervalos

[1] 0.1000000 0.2833333 0.4666667 0.6500000 0.8333333 1.0166667 1.2000000


> hist(CONTINUA, breaks=puntos)# histograma de frecuencias usando la regla de Sturges

> # Instalación de la libreria agrícolae (permite el uso de otras herramientas estadísticas):

> # En "Secure CRAN mirrors", seleccionar: "USA(IA)"

> #Tener paciencia, ya que la instalación puede tomar varios minutos

> #Esperar hasta que el cursor (> |)vuelva a estar en color rojo en la parte inferior de la consola R

> install.packages("agricolae")

Installing package into ‘C:/Users/jacks/OneDrive/Documentos/R/win-library/3.5’

(as ‘lib’ is unspecified)

--- Please select a CRAN mirror for use in this session ---

probando la URL 'https://mirror.las.iastate.edu/CRAN/bin/windows/contrib/3.5/agricolae_1.3-


2.zip'

Content type 'application/zip' length 1270991 bytes (1.2 MB)

downloaded 1.2 MB

package ‘agricolae’ successfully unpacked and MD5 sums checked


The downloaded binary packages are in

C:\Users\jacks\AppData\Local\Temp\RtmpEVmMhY\downloaded_packages

> # Gráfico de diagrama de cajas o Boxplot (organiza los datos en los cuatro cuartiles):

> boxplot(CONTINUA,ylab="unidad de medida",main="Boxplot CONTINUA")#Gráficos de cajas

> # VARIABLE CUANTITATIVA DISCRETA

>

> # Son variables de conteo, como número de personas que habitan un predio, número de crías
por parto, número de frutos por cosecha, etc.

>

> # En el siguiente renglón, reemplace y digite los 30 datos de su variable DISCRETA, separándolos
con comas:

>

> DISCRETA=c(20,33,48,63,30,20,41,50,61,80,24,46,77,80,100,28,39,72,85,100,37,44,70,30,95)

>
> # RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO

>

> summary(DISCRETA) # Resumen estadístico

Min. 1st Qu. Median Mean 3rd Qu. Max.

20.00 33.00 48.00 54.92 77.00 100.00

> min(DISCRETA) # Mínimo

[1] 20

> max(DISCRETA) # Máximo

[1] 100

> range(DISCRETA) # Rango

[1] 20 100

> mean(DISCRETA) # Media aritmética

[1] 54.92

> median(DISCRETA) # Mediana

[1] 48

> length(DISCRETA) # Número de datos

[1] 25

> sd(DISCRETA) # Desviación standar

[1] 25.67736

> quantile(DISCRETA, 0.25) # Cuantil Q1

25%

33

> quantile(DISCRETA, 0.5) # Cuantil Q2 que es la mimsa mediana

50%

48

> quantile(DISCRETA, 0.75) # Cuantil Q3

75%

77

> IQR(DISCRETA) # Rango intercuartílico


[1] 44

> sort(DISCRETA) # Ordenar

[1] 20 20 24 28 30 30 33 37 39 41 44 46 48 50 61 63 70 72 77

[20] 80 80 85 95 100 100

>

> # Para las variables discretas, las tabla de frecuencias se desarrollan por pasos:

>

> FrAbsDiscreta=table(DISCRETA) # Se le asigna el nombre de "FrAbsDiscreta" para la Tabla de


frecuencias absolutas de la variable discreta

>

> FrAbsAcumDiscreta<-as.table(cumsum(FrAbsDiscreta))# Se le asigna el nombre de


"FrAbsAcumDiscreta" para la Tabla de frecuencias absolutas acumuladas de la variable discreta

> FrAbsAcumDiscreta #Frecuencias absolutas acumuladas

20 24 28 30 33 37 39 41 44 46 48 50 61 63 70 72 77 80 85 95

2 3 4 6 7 8 9 10 11 12 13 14 15 16 17 18 19 21 22 23

100

25

> FrRelDiscreta=prop.table(table(DISCRETA))# Se le asigna el nombre de "FrRelDiscreta" para la


Tabla de frecuencias relativas de la variable discreta

> FrRelDiscreta # La frecuencia relativa se da en porcentaje, acá se presenta de 0 a 1 y para


pasarla a porcentaje se multiplica por 100

DISCRETA

20 24 28 30 33 37 39 41 44 46 48 50 61 63 70 72

0.08 0.04 0.04 0.08 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.04

77 80 85 95 100

0.04 0.08 0.04 0.04 0.08

> FrRelAcumDiscreta<-as.table(cumsum(FrRelDiscreta)) #Frecuencias relativas acumuladas

> FrRelAcumDiscreta # Para pasar a porcentaje, se debe multiplicar por 100

20 24 28 30 33 37 39 41 44 46 48 50 61 63 70 72

0.08 0.12 0.16 0.24 0.28 0.32 0.36 0.40 0.44 0.48 0.52 0.56 0.60 0.64 0.68 0.72
77 80 85 95 100

0.76 0.84 0.88 0.92 1.00

> # GRÁFICOS DE TABLA DE FRECUENCIAS (DIAGRAMA DE BARRAS)PARA VARIABLE DISCRETA:

> barplot(FrAbsDiscreta,ylab="Frecuencias Absolutas",main="Diagrama de barras Frecuencia


Absoluta DISCRETA")

> barplot(FrRelDiscreta,ylab="Frecuencia Relativa",main="Diagrama de barras Frecuencia Relativa


DISCRETA")
> barplot(FrAbsAcumDiscreta,ylab="Frecuencia Absoluta Acumulada",main="Diagrama de barras
Frecuencia Absoluta Acumulada DISCRETA")

> barplot(FrRelAcumDiscreta,ylab="Frecuencia Relativa Acumulada",main="Diagrama de barras


Frecuencia Relativa Acumulada DISCRETA")
> # Gráfico de diagrama de cajas o Boxplot para variables discretas (organiza los datos en los
cuatro cuartiles):

> boxplot(DISCRETA)

> # GRÁFICO DE TORTA PARA VARIABLE DISCRETA:

> pie(FrAbsDiscreta,col=rainbow(6),main=c("Grafico de tarta Frecuencia Absoulta DISCRETA")) #


Gráfico de tarta
> # VARIABLE CUALITATIVA O CATEGÓRICA

>

> # Son atributos no numéricos, como el nivel de estudios de una persona, el nivel de ingreso, o el
grado de ataque de un patógeno.

> # Para poder analizarlos es necesario codificarlos

> # Por ejemplo, si se hace una encuesta del nivel de estudio que tienen los agricultores de un
municipio, se pueden asignar cuatro niveles:

> # 1= sin estudio, 2= primaria, 3= secundaria y 4= universidad

> # CATEGORICA = Nivel de estudio de agricultores

>

> # En el siguiente renglón, reemplace y digite los 30 datos de su variable CUALITATIVA o


CATEGÓRICA, separándolos con comas:

>

>
CATEGORICA=c(2,2,2,2,1,1,1,1,1,1,1,1,1,1,1,1,2,2,1,1,2,2,2,1,2,2,2,2,1,1,1,1,1,1,2,1,2,2,1,2,2,2,1,2,
2,1)

>

> # Es necesario aclararle al programa que cada número es una categoría:

>

> # En el siguiente comando reemplace de acuerdo al número de niveles que tenga su variable
categórica:

>

> CATEGORICA=factor(CATEGORICA, levels=c(1,2),

+ # A continuación, indique el nombre de cada categoría:

+ # reemplace las palabras entre comillas, indicando el nombre de cada nivel de su variable:

+ labels=c("Reproductoras","No Reproductoras"))

>

> CATEGORICA # Muestra cada dato con el nombre del nivel de la categoría que se asignó
previamente
[1] No Reproductoras No Reproductoras No Reproductoras No Reproductoras

[5] Reproductoras Reproductoras Reproductoras Reproductoras

[9] Reproductoras Reproductoras Reproductoras Reproductoras

[13] Reproductoras Reproductoras Reproductoras Reproductoras

[17] No Reproductoras No Reproductoras Reproductoras Reproductoras

[21] No Reproductoras No Reproductoras No Reproductoras Reproductoras

[25] No Reproductoras No Reproductoras No Reproductoras No Reproductoras

[29] Reproductoras Reproductoras Reproductoras Reproductoras

[33] Reproductoras Reproductoras No Reproductoras Reproductoras

[37] No Reproductoras No Reproductoras Reproductoras No Reproductoras

[41] No Reproductoras No Reproductoras Reproductoras No Reproductoras

[45] No Reproductoras Reproductoras

Levels: Reproductoras No Reproductoras

>

> summary(CATEGORICA) # Hace un resumen del número de individuos que pertenecen a cada
una de las categorías asignadas

Reproductoras No Reproductoras

25 21

> table(CATEGORICA) #Tabla de frecuencias absolutas

CATEGORICA

Reproductoras No Reproductoras

25 21

> # Al asignar nombres a los comandos, no se deben repetir los que se usaron previamente:

> FrAbsCategorica=table(CATEGORICA) # Se le asigna el nombre de "FrAbsCategorica" para la


Tabla de frecuencia absoluta de la variable categórica o cualitativa

> FrAbsCategorica # Presenta la tabla de frecuencia absoluta de la variable categórica

CATEGORICA

Reproductoras No Reproductoras

25 21
> FrRelCategorica=prop.table(table(CATEGORICA))# Se le asigna el nombre de "FrRelCategorica"
para la Tabla de frecuencia relativa de la variable categorica o cualitativa

> FrRelCategorica # Indica la frecuencia de cada nivel en términos de porcentaje (multiplicar por
100)

CATEGORICA

Reproductoras No Reproductoras

0.5434783 0.4565217

> # GRÁFICOS DE VARIABLES CUALITATIVAS:

> barplot(FrAbsCategorica,ylab="Frecuencias absolutas",main="Diagrama de Barras Frecuencia


Absoluta CATEGORICA") # Diagrama de barras (frecuencia absoluta) para cada nivel de estudios
> barplot(FrRelCategorica,ylab="Frecuencias relativas",main="Diagrama de barras Frecuencia
Relativa CATEGORICA") # Diagrama de barras (frecuencia relativa) para cada nivel de estudios

> # Luis Alberto Cáceres

> # Director de curso


Conclusiones

Como conclusión obtuvimos que un 54% de los individuos son reproductores y un 46% de

los individuos no son reproductores, dicho en valores los 46 individuos escogidos 25 son

reproductores y 21 no son reproductores además se evidencio que las lombrices de mayor

peso son las que mas huevecillos ponen a lo largo de un mes a diferencia de las que pesan

entre 0.24 y 0.50 dan menos huevecillos a lo largo de un mes, con esta investigación

concluimos que para la reproducción de la lombriz en grandes cantidades es mejor separa a

los individuos que pesan mas de 0.80gr a 1.2gr para obtener más población, y los

individuos que pesan de 0.10gr a 0.70gr se aíslan para la producción de humus en su

mayoría.

Evidencia fotográfica

También podría gustarte