Está en la página 1de 21

ESTADÍSTICA DESCRIPTIVA (PARA AGRARIAS)

Fase 4. Aplicar conceptos a un proyecto agropecuario con


procesamiento estadístico

ENTREGADO POR:
MANUEL ALEJANDRO OLIVEROS

DIRECTOR DE CURSO

LUIS ALBERTO CACERES

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)

ABRIL 2020
INTRODUCCION

Este proyecto pretende implementar de manera práctica los conceptos


trabajados en las unidades anteriores, en una base de datos real y poder
procesar la información en el programa R y de esta manera potenciar el
nivel del estudiante
Objetivo general

 Aplicar conceptos a un proyecto agropecuario con procesamiento


estadístico

Objetivos específicos

 Determinar la base de datos a trabajar con variables continua, discreta


y cualitativa
 Implementar el programa R para realizar tablas de frecuencia y
gráficos de los diferentes tipos de variables
 Analizar los datos y graficas obtenidos en el programa R
DESARROLLO DE TRABAJO INDIVIDUAL

1. Definir un área de trabajo donde se puedan obtener datos de variables


continuas, discretas y cualitativas

Para la elaboración de este proyecto definimos las siguientes variables:

 Total de carros por hogar en la unidad donde vivo


 Emisiones de CO (toneladas métricas per cápita) (cuantitativa
continua) https://datos.bancomundial.org/indicador/EN.ATM.CO2E.PC?
locations=CO&view=chart
 Encuesta sobre hogares que tienen gas natural

Gestionar como mínimo 30 datos de cada una de las variables. Se debe


presentar evidencia fotográfica en el informe de la recolección de los datos

CO CARROS X CASA GAS


Continua Discreta Cualitativa
1 12416 2 natural
2 3684 1 natural
3 2010 1 bombona
4 180 1 bombona
5 2628 1 bombona
6 9355 1 bombona
7 3551 1 bombona
8 10961 0 bombona
9 2941 0 bombona
10 1058 1 bombona
11 1550 1 bombona
12 757 2 bombona
13 6282 1 natural
14 7121 0 bombona
15 386 1 bombona
16 6933 1 bombona
17 11510 0 bombona
18 3766 0 bombona
19 3294 1 bombona
20 4025 1 Natural
21 8390 1 Natural
22 6476 1 Natural
23 12992 1 Natural
24 4039 0 Natural
25 485 0 Natural
26 5671 0 bombona
27 7083 2 bombona
28 8531 1 bombona
29 2442 1 Natural
30 8674 0 Natural

ETAPA 2

Ejecutar el programa R y abrir el archivo “Codigo Fase 4

VARIABLE CUANTITATIVA CONTINUA

Presentar un cuadro resumen con los resultados obtenidos al ejecutar el


código, presentando los siguientes datos de las variables continua y
discreta:

Tabla de resumen:
Histogram of CONTINUA
8
6

El intervalo que más se repite de


Frequency

Emisiones de CO (toneladas métricas


4

per cápita) es el de 2000 a 4000 con el


#8
2
0

0 2000 4000 6000 8000 10000 12000

CONTINUA

Histogram of CONTINUA
8
6
Frequency

4
2
0

0 2000 4000 6000 8000 10000 14000

CONTINUA
Boxplot CONTINUA

La grafica de caja nos muestra de


manera gráfica los datos obtenidos de
máximo 12992, mínimo 180 y los
8000 10000

Q1=2488, Q3= 8072 y vemos que el


unidad de medida

Q2 coincide con la media


6000
4000
2000
0
VARIABLE CUANTITATIVA DISCRETA

Cuadro de resumen:

Knkbm mnm mn klmn,- l n

TABLA DE FRECUENCIA ABSOLUTA

TABLA DE FRECUENCIA RELATIVA


Diagrama de barras Frecuencia Absoluta DISCRETA Diagrama de barras Frecuencia Relativa DISCRETA

0.6
0.5
15
Frecuencias Absolutas

0.4
Frecuencia Relativa
10

0.3
0.2
5

0.1
0.0
0

0 1 2 0 1 2

Diagrama de barras Frecuencia Absoluta Acumulada DISCRETA Diagrama de barras Frecuencia Relativa Acumulada DISCRETA
1.0
30
25

0.8
Frecuencia Absoluta Acumulada

Frecuencia Relativa Acumulada


20

0.6
15

0.4
10

0.2
5

0.0
0

0 1 2 0 1 2

Las gráficas anteriores son una representación de la información plasmada


en las tablas de frecuencia. En la frecuencia absoluta podemos ver que el
dato que más se repite es el 1 con 18. Observándolo desde la gráfica de
frecuencia relativa vemos como el 0 representa el 30%, 60% para el 1 y el
10% para el 2, para un total de 100%
GRAFICOS

2.0
1.5
1.0
0.5
0.0

La grafica de boxplot es una presentación de datos importantes como valor


minimo 0, máximo 2, valor medio 1 que es el mismo Q2, presentada por la
línea negrita de la mitad.

Grafico de tarta Frecuencia Absoulta DISCRETA

La grafica de torta es otro ejemplo para poder representar los datos


plasmados en las tablas de frecuencia. Como podemos ver el dato que más
se repite es el 1 con 18, por eso vemos que el color amarillo es el que tiene
mayor porción de la torta, seguida del 2 con solo 3.
VARIABLE CATEGORICA

GRAFICOS

Diagrama de Barras Frecuencia Absoluta CATEGORICA


15
Frecuencias absolutas

10
5
0

Natural Bombona
Diagrama de barras CATEGORICA
0.8
0.6
Frecuencias relativas

0.4
0.2
0.0

Natural Bombona

Diagrama de barras Frecuencia Relativa CATEGORICA


0.6
0.5
Frecuencias relativas

0.4
0.3
0.2
0.1
0.0

Natural Bombona
CONCLUSIONES

El estudio de la estadística descriptiva nos permite realizar estudios en


cualquier área de conocimiento. Poder implementarla en un proyecto real,
me permitio realizar el ejercicio de la encueta, la recolección de la
información y la tabulación para poder analizarla con el programa R.

El programa R es una herramienta tecnológica muy potente e importante


que nos permite presentar de forma gráfica todos los resultados de la
información procesada.
BIBLIOGRAFÍAS

 Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e


infostat en
problemas de agronomía. Recuperado de
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?
docID=322177
5&query=bioestadística
 Walpole, R.E.; Myers, R.H.; Myers, S.L. & Ye, K. “Probabilidad y
estadística para ingeniería y ciencias”. Octava Edición. Pearson
Prentice-Hall. México, 2007. V
 Material docente de la Unidad de Bioestadística Clínica.
URL: http://www.hrc.es/bioest/M_docente.html
 Iniciación a la Estadística. URL:
http://descartes.cnice.mecd.es/Estadistica/iniciacion_estadististica_fjg
arcia/FGG990_UD.htm
 Estadística Descriptiva y Probabilidad. URL:
http://thales.cica.es/rd/Recursos/rd99/ed99-0278- 01/indice.html.
ANEXO- CODIGO PROGRAMA R

# CODIGO R PARA LA FASE CUATRO DEL CURSO ESTADÍSTICA


DESCRIPTIVA (300046A_614)

# PARA EJECUTAR, DIGITAR "CONTROL+R" EN CADA LÍNEA, DE ARRIBA


HACIA ABAJO

# VARIABLE CUANTITATIVA CONTINUA

# Ejemplos: peso (de animales, de cosechas, etc.), contenidos de nutrientes


en el suelo (ppm), pH, edad, material particulado, etc.
# En el siguiente renglón reemplace y digite los 30 datos de su variable
CONTINUA, separándolos con comas. Para números decimales use punto:

CONTINUA=c(12416,3684,2010,180,2628,9355,3551,10961,2941,1058,155
0,757,6282,7121,386,6933,11510,3766,3294,4025,8390,6476,12992,4039,
485,5671,7083,8531,2442,8674)

# RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO

summary(CONTINUA)# Resumen estadístico


mean(CONTINUA)#media aritmética
var(CONTINUA)#varianza
sd(CONTINUA)#desviación estándar
min(CONTINUA) #Mínimo
max(CONTINUA)# Máximo
range(CONTINUA) #Rango
median(CONTINUA)# Mediana
length(CONTINUA)# Número de datos
quantile(CONTINUA, 0.25)# Cuantil Q1
quantile(CONTINUA, 0.5)# Cuantil Q2 que es la mimsa mediana
quantile(CONTINUA, 0.75)# Cuantil Q3
IQR(CONTINUA) #Rango intercuartílico
sort(CONTINUA)# Ordenar

# TABLA DE FRECUENCIAS (HISTOGRAMA)PARA VARIABLE CONTINUA, CON


REGLA DE STURGES
# La regla de Sturges define el número de rangos para organizar la tabla de
frecuencias:
range(CONTINUA,na.rm=TRUE) # incluimos na.rm=TRUE para que ignore
la presencia de valores perdidos
nclass.Sturges(CONTINUA)# Define el número de intervalos para presentar
la frecuencia de la variable (en este caso, 6 intervalos)
seq(min(CONTINUA),max(CONTINUA),length=nclass.Sturges(CONTINUA))
# Límites de los intervalos
intervalosCONTINUA=cut(CONTINUA,breaks=seq(min(CONTINUA),max(CON
TINUA),length=nclass.Sturges(min(CONTINUA))),include.lowest=TRUE)
intervalosCONTINUA# Se muestran los intervalos de edad, uno
correspondiente a cada edad observada
puntos=min(CONTINUA)+(0:nclass.Sturges(CONTINUA))*(max(CONTINUA)-
min(CONTINUA))/nclass.Sturges(CONTINUA)

hist(CONTINUA, breaks=puntos)# histograma de frecuencias usando la regla


de Sturges

# Instalación de la libreria agrícolae (permite el uso de otras herramientas


estadísticas):
# En "Secure CRAN mirrors", seleccionar: "USA(IA)"
#Tener paciencia, ya que la instalación puede tomar varios minutos
#Esperar hasta que el cursor (> |)vuelva a estar en color rojo en la parte
inferior de la consola R

install.packages("agricolae")

library(agricolae) # si la libreria se instaló correctamente, al dar


CONTROL+R se pone Rojo

# TABLAS DE FRECUENCIAS SIN REGLA DE STURGES:


# Existen dos comandos que generan la misma tabla de frecuencia o
histograma:

# Gráficos de tabla de frecuencia:


tbFreqCONTINUA=table.freq(hist(CONTINUA,plot=TRUE))

hist(CONTINUA,ylab="Frecuencia",main="Histograma
CONTINUA")#Histograma

# Tabla de frecuencia:

tbFreqCONTINUA
# Gráfico de diagrama de cajas o Boxplot (organiza los datos en los cuatro
cuartiles):

boxplot(CONTINUA,ylab="unidad de medida",main="Boxplot
CONTINUA")#Gráficos de cajas

# VARIABLE CUANTITATIVA DISCRETA

# Son variables de conteo, como número de personas que habitan un


predio, número de crías por parto, número de frutos por cosecha, etc.

# En el siguiente renglón, reemplace y digite los 30 datos de su variable


DISCRETA, separándolos con comas:

DISCRETA=c(2,1,1,1,1,1,1,0,0,1,1,2,1,0,1,1,0,0,1,1,1,1,1,0,0,0,2,1,1,0)

# RECUERDE QUE NO DEBE CAMBIAR NINGUNA LINEA DEL CODIGO

summary(DISCRETA) # Resumen estadístico


min(DISCRETA) # Mínimo
max(DISCRETA) # Máximo
range(DISCRETA) # Rango
mean(DISCRETA) # Media aritmética
median(DISCRETA) # Mediana
length(DISCRETA) # Número de datos
sd(DISCRETA) # Desviación standar
quantile(DISCRETA, 0.25) # Cuantil Q1
quantile(DISCRETA, 0.5) # Cuantil Q2 que es la mimsa mediana
quantile(DISCRETA, 0.75) # Cuantil Q3
IQR(DISCRETA) # Rango intercuartílico
sort(DISCRETA) # Ordenar

# Para las variables discretas, las tabla de frecuencias se desarrollan por


pasos:

FrAbsDiscreta=table(DISCRETA) # Se le asigna el nombre de


"FrAbsDiscreta" para la Tabla de frecuencias absolutas de la variable discreta

FrAbsAcumDiscreta<-as.table(cumsum(FrAbsDiscreta))# Se le asigna el
nombre de "FrAbsAcumDiscreta" para la Tabla de frecuencias absolutas
acumuladas de la variable discreta
FrAbsAcumDiscreta #Frecuencias absolutas acumuladas
FrRelDiscreta=prop.table(table(DISCRETA))# Se le asigna el nombre de
"FrRelDiscreta" para la Tabla de frecuencias relativas de la variable discreta
FrRelDiscreta # La frecuencia relativa se da en porcentaje, acá se presenta
de 0 a 1 y para pasarla a porcentaje se multiplica por 100
FrRelAcumDiscreta<-as.table(cumsum(FrRelDiscreta)) #Frecuencias
relativas acumuladas
FrRelAcumDiscreta # Para pasar a porcentaje, se debe multiplicar por 100

# GRÁFICOS DE TABLA DE FRECUENCIAS (DIAGRAMA DE BARRAS)PARA


VARIABLE DISCRETA:

barplot(FrAbsDiscreta,ylab="Frecuencias Absolutas",main="Diagrama de
barras Frecuencia Absoluta DISCRETA")
barplot(FrRelDiscreta,ylab="Frecuencia Relativa",main="Diagrama de barras
Frecuencia Relativa DISCRETA")
barplot(FrAbsAcumDiscreta,ylab="Frecuencia Absoluta
Acumulada",main="Diagrama de barras Frecuencia Absoluta Acumulada
DISCRETA")
barplot(FrRelAcumDiscreta,ylab="Frecuencia Relativa
Acumulada",main="Diagrama de barras Frecuencia Relativa Acumulada
DISCRETA")

# Gráfico de diagrama de cajas o Boxplot para variables discretas (organiza


los datos en los cuatro cuartiles):

boxplot(DISCRETA)

# GRÁFICO DE TORTA PARA VARIABLE DISCRETA:

pie(FrAbsDiscreta,col=rainbow(6),main=c("Grafico de tarta Frecuencia


Absoulta DISCRETA")) # Gráfico de tarta

# VARIABLE CUALITATIVA O CATEGÓRICA

# Son atributos no numéricos, como el nivel de estudios de una persona, el


nivel de ingreso, o el grado de ataque de un patógeno.
# Para poder analizarlos es necesario codificarlos
# Por ejemplo, si se hace una encuesta del nivel de estudio que tienen los
agricultores de un municipio, se pueden asignar cuatro niveles:
# 1= sin estudio, 2= primaria, 3= secundaria y 4= universidad
# CATEGORICA = Nivel de estudio de agricultores
# En el siguiente renglón, reemplace y digite los 30 datos de su variable
CUALITATIVA o CATEGÓRICA, separándolos con comas:

CATEGORICA=c(1,1,2,2,2,2,2,2,2,2,2,2,1,2,2,2,2,2,2,1,1,1,1,1,1,2,2,2,1,1)

# Es necesario aclararle al programa que cada número es una categoría:

# En el siguiente comando reemplace de acuerdo al número de niveles que


tenga su variable categórica:

CATEGORICA=factor(CATEGORICA, levels=c(1,2),

# A continuación, indique el nombre de cada categoría:


# reemplace las palabras entre comillas, indicando el nombre de cada nivel
de su variable:

labels=c("Natural","Bombona"))

CATEGORICA # Muestra cada dato con el nombre del nivel de la categoría


que se asignó previamente

summary(CATEGORICA) # Hace un resumen del número de individuos que


pertenecen a cada una de las categorías asignadas
table(CATEGORICA) #Tabla de frecuencias absolutas

# Al asignar nombres a los comandos, no se deben repetir los que se usaron


previamente:

FrAbsCategorica=table(CATEGORICA) # Se le asigna el nombre de


"FrAbsCategorica" para la Tabla de frecuencia absoluta de la variable
categórica o cualitativa
FrAbsCategorica # Presenta la tabla de frecuencia absoluta de la variable
categórica
FrRelCategorica=prop.table(table(CATEGORICA))# Se le asigna el nombre
de "FrRelCategorica" para la Tabla de frecuencia relativa de la variable
categorica o cualitativa
FrRelCategorica # Indica la frecuencia de cada nivel en términos de
porcentaje (multiplicar por 100)

# GRÁFICOS DE VARIABLES CUALITATIVAS:


barplot(FrAbsCategorica,ylab="Frecuencias absolutas",main="Diagrama de
Barras Frecuencia Absoluta CATEGORICA") # Diagrama de barras
(frecuencia absoluta) para cada nivel de estudios
barplot(FrRelCategorica,ylab="Frecuencias relativas",main="Diagrama de
barras Frecuencia Relativa CATEGORICA") # Diagrama de barras (frecuencia
relativa) para cada nivel de estudios

# Luis Alberto Cáceres


# Director de curso
# Estadística Descriptiva (para agrarias)

También podría gustarte