Está en la página 1de 24

UNIDAD 2 – FASE 4 – PROYECTO DE CON PROCESAMIENTO ESTADISTICO

CURSO 

Estadística Descriptiva 

PRESENTADO POR 

Kelly Yurani Sanchez Ortiz 

NÚMERO DE GRUPO 

300046_29

NOMBRE DEL TUTOR 

Luis Alberto Cáceres Torres

UNIVERSIDAD ABIERTA Y DISTANCIA UNAD 

AGRONOMÍA 

ESCUELA DE CIENCIAS AGRÍCOLAS, PECUARIAS Y DEL MEDIO

AMBIENTE

(ECAPMA)

2020
INTRODUCCION

En este trabajo se aplica los conceptos de estadística aprendidos en el curso por medio del
desarrollo de un proyecto agrícola, con procesamiento estadístico, identificando las
variables, continuas, discretas y cualitativas. La actividad se realizó en el cultivo de tomate
de la finca el pedregalito, del Propietario Freddy Gómez en el Municipio de Abrego norte
de Santander y aplicando el software R.
ETAPA 1

1. Defina un área de trabajo donde se puedan obtener datos de variables


continuas, discretas y cualitativas.
El área que se tomó para trabajar el tema de variables continuas, discretas y
cualitativas es la de un cultivo de tomate ubicado en el municipio de Abrego
Norte de Santander; donde se tomó como variable continua el peso de los
tomates, la variable discreta como el número de tomates y como variable
cualitativa se tomó la categoría tamaños 1: pequeño; 2: Mediano y 3:
Grande.

2. Indique la ubicación del sitio fuente de los datos: institución, municipio,


vereda y/o finca si aplica. El informe debe presentar los detalles de la locación
elegida que permitan entender el contexto sobre el cual se realiza la
investigación.
El Cultivo de tomate se encuentra en la finca el pedregalito, del Propietario
Freddy Gómez, en Abrego Norte de Santander; sus coordenadas so
8°04’27,6”N 73°11’47.7”W

Ilustración 1. Ubicación Abrego Norte de Santander Coordenadas


3. Determine una variable continua, una discreta y una cualitativa. Se debe
realizar una descripción clara de cada una de las variables elegidas y la
metodología utilizada para la recolección de la información.

 Variable continua

Se trabajó con el peso del fruto, en general, cuanto más grandes son los
tomates que produce una planta menor es la cantidad de éstos.

Pesos del fruto

{245,255,265,280,290,305,320,335,345,355,370,385,400,415,430,440
10,25,40,75,110,120,135,150,160,175,185,200,215,230 ,
}
 Variable Discreta
Se trabajó con el número de tomates que cada planta produce, podemos
esperar que cada planta produzca entre 20 y 40 frutos, dependiendo de la
duración de la temporada de cultivo y de los factores que influyen en la
producción.

Numero de tomates por cada planta

{15,30,50,200,36,98,100,140,315,25,47,10,22,400,230,350
190,405,28,90,69,160,220,180,280,370,420,310,410,110 }
,

 Variable Cualitativa
Se decidió trabajar con los tamaños de los tomates, 1. Pequeño a lo que le
asociaremos el color verde, 2. Medianos con el color naranja y 3. Grande
con el color rojo; con las 30 plantas que podrán producir de diferentes
tamaños.
{ 1,2,3,3,2,1,3,2,3,2,3,1,2,3,2,1,3,2,1,3,2,3,2,1,2,1,2,3,1,2 , }
4. Se debe presentar evidencia fotográfica en el informe que brinde una
contextualización del entorno donde se realizó la investigación y donde
aparezca el estudiante recolectando los datos.
ETAPA 2

R version 4.0.2 (2020-06-22) -- "Taking Off Again"


Copyright (C) 2020 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)

R es un software libre y viene sin GARANTIA ALGUNA.


Usted puede redistribuirlo bajo ciertas circunstancias.
Escriba 'license()' o 'licence()' para detalles de distribucion.

R es un proyecto colaborativo con muchos contribuyentes.


Escriba 'contributors()' para obtener más información y
'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,


o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.
Escriba 'q()' para salir de R.

> # CODIGO R PARA LA FASE CUATRO DEL CURSO ESTADÍSTICA


DESCRIPTIVA (300046A_764)
>
> # PARA EJECUTAR, DIGITAR "CONTROL+R" EN CADA LÍNEA, DE
ARRIBA HACIA ABAJO
>
> # VARIABLE CUANTITATIVA CONTINUA
>
>
CONTINUA=c(10,25,40,75,110,120,135,150,160,175,185,200,215,230,245,255,265,280,2
90,305,320,335,345,355,370,385,400,415,430,440)
>
> # RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO
>
> summary(CONTINUA)# Resumen estadístico
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.0 152.5 250.0 242.2 342.5 440.0
> mean(CONTINUA)#media aritmética
[1] 242.1667
> var(CONTINUA)#varianza
[1] 15577.04
> sd(CONTINUA)#desviación estándar
[1] 124.808
> min(CONTINUA) #Mínimo
[1] 10
> max(CONTINUA)# Máximo
[1] 440
> range(CONTINUA) #Rango
[1] 10 440
> median(CONTINUA)# Mediana
[1] 250
> length(CONTINUA)# Número de datos
[1] 30
> quantile(CONTINUA, 0.25)# Cuantil Q1
25%
152.5
> quantile(CONTINUA, 0.5)# Cuantil Q2 que es la mimsa mediana
50%
250
> quantile(CONTINUA, 0.75)# Cuantil Q3
75%
342.5
> IQR(CONTINUA) #Rango intercuartílico
[1] 190
> sort(CONTINUA)# Ordenar
[1] 10 25 40 75 110 120 135 150 160 175 185 200 215 230 245 255 265 280 290
[20] 305 320 335 345 355 370 385 400 415 430 440
>
> # TABLA DE FRECUENCIAS (HISTOGRAMA)PARA VARIABLE
CONTINUA, CON REGLA DE STURGES
> # La regla de Sturges define el número de rangos para organizar la tabla de
frecuencias:
>
> range(CONTINUA,na.rm=TRUE) # incluimos na.rm=TRUE para que ignore la
presencia de valores perdidos
[1] 10 440
> nclass.Sturges(CONTINUA)# Define el número de intervalos para presentar la
frecuencia de la variable (en este caso, 6 intervalos)
[1] 6
> seq(min(CONTINUA),max(CONTINUA),length=nclass.Sturges(CONTINUA)) #
Límites de los intervalos
[1] 10 96 182 268 354 440
>
intervalosCONTINUA=cut(CONTINUA,breaks=seq(min(CONTINUA),max(CONTINUA
),length=nclass.Sturges(min(CONTINUA))),include.lowest=TRUE)
> intervalosCONTINUA# Se muestran los intervalos de edad, uno correspondiente a
cada edad observada
[1] [9.57,53] [9.57,53] [9.57,53] (53,96] (96,139] (96,139] (96,139]
[8] (139,182] (139,182] (139,182] (182,225] (182,225] (182,225] (225,268]
[15] (225,268] (225,268] (225,268] (268,311] (268,311] (268,311] (311,354]
[22] (311,354] (311,354] (354,397] (354,397] (354,397] (397,440] (397,440]
[29] (397,440] (397,440]
10 Levels: [9.57,53] (53,96] (96,139] (139,182] (182,225] ... (397,440]
> puntos=min(CONTINUA)+(0:nclass.Sturges(CONTINUA))*(max(CONTINUA)-
min(CONTINUA))/nclass.Sturges(CONTINUA)
>
> hist(CONTINUA,
breaks=puntos,xlab="Intervalos",ylab="Frecuencia",main="PERIODO 764 - Histograma
CONTINUA con regla de Sturges") # histograma de frecuencias usando la regla de Sturges
>
>
> # Instalación de la libreria agrícolae (permite el uso de otras herramientas
estadísticas):
> # En "Secure CRAN mirrors", seleccionar: "USA(IA)"
> #Tener paciencia, ya que la instalación puede tomar varios minutos
> #Esperar hasta que el cursor (> |)vuelva a estar en color rojo en la parte inferior de
la consola R
>
> install.packages("agricolae")
Installing package into ‘C:/Users/KELLY/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
--- Please select a CRAN mirror for use in this session ---
Error in contrib.url(repos, "source") :
trying to use CRAN without setting a mirror
>
> library(agricolae) # si la libreria se instaló correctamente, al dar CONTROL+R se
pone Rojo
Error in library(agricolae) : there is no package called ‘agricolae’
>
> # TABLAS DE FRECUENCIAS SIN REGLA DE STURGES:
> # Existen dos comandos que generan la misma tabla de frecuencia o histograma:
>
> # Gráficos de tabla de frecuencia:
> tbFreqCONTINUA=table.freq(hist(CONTINUA,plot=TRUE))
Error in table.freq(hist(CONTINUA, plot = TRUE)) :
no se pudo encontrar la función "table.freq"
>
> hist(CONTINUA,xlab="Intervalos",ylab="Frecuencia",main="PERIODO 764 -
Histograma variable CONTINUA")#Histograma
>
> # Tabla de frecuencia:
>
> tbFreqCONTINUA
Error: objeto 'tbFreqCONTINUA' no encontrado
>
> # Gráfico de diagrama de cajas o Boxplot (organiza los datos en los cuatro
cuartiles):
>
> boxplot(CONTINUA,ylab="unidad de medida",main="PERIODO 764 - Boxplot
variable CONTINUA")#Gráficos de cajas
GRAFICAS ANALISIS

PERIODO 764 - Histograma CONT INUA con regla de Sturges


6
5
F re c u e n c ia

4
3
2
1
0

0 100 200 300 400

Intervalos

En este gráfico se puede observar el nivel de la categoría que corresponden a los pesos de
los frutos, en el cual se puede identificar que en los niveles de la barra entre 0 a 150
muestra un peso continuo, de 160 a 230 y de 300 a 370 un peso un poco más alto que el
continuo y entre un 230 a 270 y 370 a 400 son los pesos más altos que vamos a encontrar.
PERIODO 764 - Boxplot variable CONTINUA

400
unidad de medida

300
200
100
0

Se puede observar claramente que el peso promedio que vamos a encontrar por lo generar
en variedad de plantas que dan este fruto es de 250.

> # VARIABLE CUANTITATIVA DISCRETA


>
> # Son variables de conteo, como número de personas que habitan un predio,
número de crías por parto, número de frutos por cosecha, etc.
>
> # En el siguiente renglón, reemplace y digite los 30 datos de su variable
DISCRETA, separándolos con comas:
>
> DISCRETA=c(4,1,2,4,1,0,5,4,3,2,4,6,7,8,11,5,6,9,13,14)
>
>
DISCRETA=c(15,30,50,200,36,98,100,140,315,25,47,10,22,400,230,250,190,405,28,90,69
,160,220,180,280,370,420,310,410,110)
>
> # RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO
>
> summary(DISCRETA) # Resumen estadístico
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.00 47.75 150.00 173.67 272.50 420.00
> min(DISCRETA) # Mínimo
[1] 10
> max(DISCRETA) # Máximo
[1] 420
> range(DISCRETA) # Rango
[1] 10 420
> mean(DISCRETA) # Media aritmética
[1] 173.6667
> median(DISCRETA) # Mediana
[1] 150
> length(DISCRETA) # Número de datos
[1] 30
> sd(DISCRETA) # Desviación standar
[1] 137.1552
> quantile(DISCRETA, 0.25) # Cuantil Q1
25%
47.75
> quantile(DISCRETA, 0.5) # Cuantil Q2 que es la mimsa mediana
50%
150
> quantile(DISCRETA, 0.75) # Cuantil Q3
75%
272.5
> IQR(DISCRETA) # Rango intercuartílico
[1] 224.75
> sort(DISCRETA) # Ordenar
[1] 10 15 22 25 28 30 36 47 50 69 90 98 100 110 140 160 180 190 200
[20] 220 230 250 280 310 315 370 400 405 410 420
>
> # Para las variables discretas, las tabla de frecuencias se desarrollan por pasos:
>
> FrAbsDiscreta=table(DISCRETA) # Se le asigna el nombre de "FrAbsDiscreta"
para la Tabla de frecuencias absolutas de la variable discreta
>
> FrAbsAcumDiscreta<-as.table(cumsum(FrAbsDiscreta))# Se le asigna el nombre
de "FrAbsAcumDiscreta" para la Tabla de frecuencias absolutas acumuladas de la variable
discreta
> FrAbsAcumDiscreta #Frecuencias absolutas acumuladas
10 15 22 25 28 30 36 47 50 69 90 98 100 110 140 160 180 190 200 220
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
230 250 280 310 315 370 400 405 410 420
21 22 23 24 25 26 27 28 29 30
> FrRelDiscreta=prop.table(table(DISCRETA))# Se le asigna el nombre de
"FrRelDiscreta" para la Tabla de frecuencias relativas de la variable discreta
> FrRelDiscreta # La frecuencia relativa se da en porcentaje, acá se presenta de 0 a 1
y para pasarla a porcentaje se multiplica por 100
DISCRETA
10 15 22 25 28 30 36
0.03333333 0.03333333 0.03333333 0.03333333 0.03333333 0.03333333
0.03333333
47 50 69 90 98 100 110
0.03333333 0.03333333 0.03333333 0.03333333 0.03333333 0.03333333
0.03333333
140 160 180 190 200 220 230
0.03333333 0.03333333 0.03333333 0.03333333 0.03333333 0.03333333
0.03333333
250 280 310 315 370 400 405
0.03333333 0.03333333 0.03333333 0.03333333 0.03333333 0.03333333
0.03333333
410 420
0.03333333 0.03333333
> FrRelAcumDiscreta<-as.table(cumsum(FrRelDiscreta)) #Frecuencias relativas
acumuladas
> FrRelAcumDiscreta # Para pasar a porcentaje, se debe multiplicar por 100
10 15 22 25 28 30 36
0.03333333 0.06666667 0.10000000 0.13333333 0.16666667 0.20000000
0.23333333
47 50 69 90 98 100 110
0.26666667 0.30000000 0.33333333 0.36666667 0.40000000 0.43333333
0.46666667
140 160 180 190 200 220 230
0.50000000 0.53333333 0.56666667 0.60000000 0.63333333 0.66666667
0.70000000
250 280 310 315 370 400 405
0.73333333 0.76666667 0.80000000 0.83333333 0.86666667 0.90000000
0.93333333
410 420
0.96666667 1.00000000
>
> # GRÁFICOS DE TABLA DE FRECUENCIAS (DIAGRAMA DE
BARRAS)PARA VARIABLE DISCRETA:
>
> barplot(FrAbsDiscreta,ylab="Frecuencias Absolutas",main="PERIODO 764 -
Diagrama de barras Frecuencia Absoluta DISCRETA")
> barplot(FrRelDiscreta,ylab="Frecuencia Relativa",main="PERIODO 764 -
Diagrama de barras Frecuencia Relativa DISCRETA")
> barplot(FrAbsAcumDiscreta,ylab="Frecuencia Absoluta
Acumulada",main="PERIODO 764 - Diagrama de barras Frecuencia Absoluta Acumulada
DISCRETA")
> barplot(FrRelAcumDiscreta,ylab="Frecuencia Relativa
Acumulada",main="PERIODO 764 - Diagrama de barras Frecuencia Relativa Acumulada
DISCRETA")
>
> # Gráfico de diagrama de cajas o Boxplot para variables discretas (organiza los
datos en los cuatro cuartiles):
>
> boxplot(DISCRETA,ylab="unidad de medida",main="PERIODO 764 - Boxplot
DISCRETA")
>
> # GRÁFICO DE TORTA PARA VARIABLE DISCRETA:
>
> pie(FrAbsDiscreta,col=rainbow(6),main=c("PERIODO 764 - Grafico de tarta
Frecuencia Absoluta DISCRETA")) # Gráfico de tarta

GRAFICAS ANALISIS
PERIODO 764 - Diagrama de barras Frecuencia Absoluta DISCRETA

1.0
0.8
0.6
Frecuencias Absolutas

0.4
0.2
0.0

10 15 22 25 28 30 36 47 50 69 90 98 100 140 180 200 230 280 315 400 410

En esta grafica podemos observar como 10 o 410 plantas tienen por porcentajes muy
mínimos una cantidad de fruto muy parecida lo único que varía es su peso por que existen
tomates medianos grandes y pequeños

PERIODO 764 - Diagrama de barras Frecuencia Relativa Acumulada DISCRETA


1.0
0.8
Frecuencia Relativa Acumulada

0.6
0.4
0.2
0.0

10 15 22 25 28 30 36 47 50 69 90 98 100 140 180 200 230 280 315 400 410


En esta podemos observar que los frutos en cada planta dependiendo de la cantidad que
tengan van en un orden de entre más poquitas plantas se obtienen pocos frutos, por eso se
muestra la descendencia de menos a mayor .

PERIODO 764 - Boxplot DISCRETA

400
300
unidad de medida

200
100
0

Como bien lo muestra la imagen nos da a conocer que el promedio de las palmas evaluadas,
podemos encontrar entre 150 frutos, siendo este el promedio estimado según lo muestra el
estudio realizado, lo cual nos indica de que al estar la producción baja, aún tiene frutos que
mantienen la producción la cual nos da a conocer que fue útil este estudio para saber su
estimado de producción.
PERIODO 764 - Grafico de tarta Frecuencia Absoluta DISCRETA

50 47 36
69 30
90 28
98 25
100 22
110 15
140 10
160 420
180 410
190 405
200 400
220 370
230 315
250 280 310

El grafico de frecuencia de tarta nos muestra el nivel dependiendo del porcentaje


correspondiente a cada categoría, como se puede apreciar todo está en pociones muy
constantes o similares no iguales pero si con cantidades parecidas.

> # VARIABLE CUALITATIVA O CATEGÓRICA

> # Son atributos no numéricos, como el nivel de estudios de una persona, el nivel de
ingreso, o el grado de ataque de un patógeno.
> # Para poder analizarlos es necesario codificarlos
> # Por ejemplo, si se hace una encuesta del nivel de estudio que tienen los
agricultores de un municipio, se pueden asignar cuatro niveles:
> # 1= Pequeño, 2= Mediano y 3= Grande
> # CATEGORICA = Tamaños de los tomates
>
> # En el siguiente renglón, reemplace y digite los 30 datos de su variable
CUALITATIVA o CATEGÓRICA, separándolos con comas:
>
> CATEGORICA=c(1,2,3,3,2,1,3,2,3,2,3,1,2,3,2,1,3,2,1,3,2,3,2,1,2,1,2,3,1,2)
>
> # Es necesario aclararle al programa que cada número es una categoría:
>
> # En el siguiente comando reemplace de acuerdo al número de niveles que tenga su
variable categórica:
>
> CATEGORICA=factor(CATEGORICA, levels=c(1,2,3),
+
+ # A continuación, indique el nombre de cada categoría:
+ # reemplace las palabras entre comillas, indicando el nombre de cada nivel de su
variable:
+
+ labels=c("Pequeño","Mediano","Grande"))
>
> CATEGORICA # Muestra cada dato con el nombre del nivel de la categoría que
se asignó previamente
[1] Pequeño Mediano Grande Grande Mediano Pequeño Grande Mediano Grande
[10] Mediano Grande Pequeño Mediano Grande Mediano Pequeño Grande
Mediano
[19] Pequeño Grande Mediano Grande Mediano Pequeño Mediano Pequeño
Mediano
[28] Grande Pequeño Mediano
Levels: Pequeño Mediano Grande
>
> summary(CATEGORICA) # Hace un resumen del número de individuos que
pertenecen a cada una de las categorías asignadas
Pequeño Mediano Grande
8 12 10
> table(CATEGORICA) #Tabla de frecuencias absolutas
CATEGORICA
Pequeño Mediano Grande
8 12 10
>
> # Al asignar nombres a los comandos, no se deben repetir los que se usaron
previamente:
>
> FrAbsCategorica=table(CATEGORICA) # Se le asigna el nombre de
"FrAbsCategorica" para la Tabla de frecuencia absoluta de la variable categórica o
cualitativa
> FrAbsCategorica # Presenta la tabla de frecuencia absoluta de la variable
categórica
CATEGORICA
Pequeño Mediano Grande
8 12 10
> FrRelCategorica=prop.table(table(CATEGORICA))# Se le asigna el nombre de
"FrRelCategorica" para la Tabla de frecuencia relativa de la variable categorica o
cualitativa
> FrRelCategorica # Indica la frecuencia de cada nivel en términos de porcentaje
(multiplicar por 100)
CATEGORICA
Pequeño Mediano Grande
0.2666667 0.4000000 0.3333333
>
> # GRÁFICOS DE VARIABLES CUALITATIVAS:
> barplot(FrAbsCategorica,ylab="Frecuencias absolutas",main="PERIODO 764 -
Diagrama de Barras Frecuencia Absoluta CATEGORICA") # Diagrama de barras
(frecuencia absoluta) para cada nivel de estudios
> barplot(FrRelCategorica,ylab="Frecuencias relativas",main="PERIODO 764 -
Diagrama de barras Frecuencia Relativa CATEGORICA") # Diagrama de barras
(frecuencia relativa) para cada nivel de estudios
>
>
> # Luis Alberto Cáceres
> # Director de curso
> # Estadística Descriptiva (para agrarias)

PERIODO 764 - Diagrama de Barras Frecuencia Absoluta CATEGORICA


12
10
Frecuencias absolutas

8
6
4
2
0

Pequeño Mediano Grande

En esta grafica finalmente se puede observar como la frecuencia absoluta de la variable


categórica, en el tamaño del fruto evaluado cada casilla correspondiente a la categoría
pequeños en el conteo realizado por el programa R se puede concluir que hay exactamente
8 plantas que contienen tomates pequeños, en la categoría mediano, 12 y en la grande 10,
dando como conclusión que por lo general las plantas en esta finca mencionada están dando
en promedio más tomates medianos.
CONCLUSIONES

Es importante realizar un análisis continuo discreto y cualitativo a ciertas circunstancias


que se nos presentan en el ámbito laboral en este caso particular en un cultivo de tomate
donde podemos ver como atreves de estas variables mediante técnicas que ayudan a tener
una idea o a observar las probabilidades de los frutos que pueden dar las plantas en este
caso los tomates y así conocer sus pesos y tamaños por cantidades de plantas.

También podría gustarte