Está en la página 1de 4

# EJERCICIO FINAL PRUEBA OBJETIVA ABIERTA CURSO 300046A_951 - ESTAD�STICA

DESCRIPTIVA (PARA AGRARIAS)

# Cuando el volumen de informaci�n es alto, se pueden importar de una hoja de


c�lculo en formato "*.csv"
# Los datos con los que vamos a trabajar se encuentran en el archivo "Final.CSV"
# Deben descargarlo y ubicar tanto la hoja de c�lculo como este c�digo en una misma
carpeta (se sugiere nombrarla: "Estadistica Descriptiva" )
# No abra ni modifique el archivo, s�lo gu�rdelo en la carpeta "Estadistica
descriptiva"

# VARIABLE CUANTITATIVA DISCRETA

# Recuerde que debe ubicarse en cada l�nea del c�digo y digitar al mismo tiempo:
"Control+R" para ejecutar cada comando
# No se salte ninguna l�nea porque puede aparecerle errores en la ejecuci�n de los
comandos

getwd() # Debe aparecer la carpeta "Estadistica descriptiva" donde guardaron


los archivos "Script Fase 5 - Final.txt" y "Final.csv"
# Si no les aparece la carpeta, el programa R no va a encontrar la base de datos y
R mostrar� un mensaje de error al intentar abrirla

PROBA=read.table("Final.csv",header=T,sep=";",dec=",")
attach(PROBA)
attach(PROBA) # Muestra los nombres de las variables sobre los cuales
R va a hacer los c�lculos

# Si el programa logr� leer la hoja de c�lculo Final.csv, con el siguiente comando


le debe aparecer:

View(PROBA)
# Ci�rrela y contin�e ejecutando el c�digo

# El grupo debe escoger entre los tres tipos de variables discretas existentes:
# Para los estudiantes de zootecnia, la variable "Zoo_discreta", que es el n�mero
de lechones por cerda.
# Para los estudiantes de agronom�a, la variable "Agri_discreta", que es el n�mero
de �caros por hoja.
# Para los estudiantes de ambiental, la variable "Amb_discreta", que corresponde al
n�mero de hogares que reciclan en 100 barrios
# Si en el grupo hay estudiantes de distintos programas, deben ponerse de acuerdo
para escoger una sola variable con la que van a trabajar

CONTEO=Zoo_discreta # En esta linea reemplaze la palabra "Zoo_discreta" por la


variable seleccionada por el grupo

# Si el grupo seleccion� "Agri_discreta" entonces la l�nea previa deber� quedar


as�: CONTEO=Agri_discreta
# No debe reemplazar nada m�s, porque de lo contrario puede aparecerle alg�n error

min(CONTEO)
max(CONTEO)
table(CONTEO) # Tabla de frecuencias absolutas
fabs=table(CONTEO) # Tabla de frecuencias absolutas
fabs
fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas
fabsacum
frel=prop.table(table(CONTEO)) # Tabla de frecuencias relativas
frel
frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
frelacum

# GRAFICOS PARA VARIABLES DISCRETAS


barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 951 - FRECUENCIAS ABSOLUTAS
- DISCRETA") # Frecuencias absolutas
barplot(frel,ylab="Frecuencias relativas",main="PERIODO 951 - FRECUENCIAS RELATIVAS
- DISCRETA") # Frecuencias relativas
barplot(frelacum,ylab="Frecuencias relativas",main="PERIODO 951 - FRECUENCIAS
RELATIVAS ACUMULADAS - DISCRETA") #Frecuencias relativas acumuladas

# VARIABLE CUANTITATIVA CONTINUA

PROBA=read.table("Final.csv",header=T,sep=";",dec=",")
attach(PROBA) # Muestra el nombre de las variables sobre los que
el programa R va a hacer los c�lculos
attach(PROBA)

# Instalaci�n del paquete "fdth"


# Cuando aparezca el listado, elegir: "0-cloud [https]" y despu�s: "fdth". hacer
clic en "OK"
# Esperar hasta que instale el paquete de comandos, puede tardar varios minutos
# Esperar hasta que el cursor se vea de nuevo de color rojo en la parte de abajo de
la Consola R

utils:::menuInstallPkgs() # seleccionar: "0-cloud [https]" y despu�s: "fdth"

library(fdth) # si se muestra en rojo en la Consola R, indica que se instal�


correctamente

# El grupo debe escoger entre los tres tipos de variables continuas existentes:
# Para los estudiantes de zootecnia, la variable "Zoo_continua", que es el peso de
conejos.
# Para los estudiantes de agronom�a, la variable "Agri_continua", que es el
potencial de hidr�geno del suelo.
# Para los estudiantes de ambiental, la variable "Amb_continua", que corresponde al
material particulado de 2.5
# Si en el grupo hay estudiantes de distintos programas, deben ponerse de acuerdo
para escoger una sola variable con la que van a trabajar

VARIABLECONTINUA=Zoo_continua # En esta linea reemplaze la palabra "Zoo_continua"


por la variable seleccionada por el grupo

# Si el grupo seleccion� "Agri_continua" entonces la l�nea previa deber� quedar


as�: VARIABLECONTINUA=Agri_continua

summary(VARIABLECONTINUA)
minimos=min(VARIABLECONTINUA)
minimos
maximos=max(VARIABLECONTINUA)
maximos
median(VARIABLECONTINUA)
VARIANZA=var(VARIABLECONTINUA)
VARIANZA
sd(VARIABLECONTINUA)
SIGMA=sqrt(VARIANZA)
SIGMA
length(VARIABLECONTINUA)

# TABLA DE FRECUENCIAS

dist <- fdt(VARIABLECONTINUA)


dist # Esta tabla presenta el intervalo inferior y superior, la
frecuencia absoluta (f), frecuencia relativa (rf), frecuencia relativa en porcenaje
(rf(%)), frecuencia acumulada (cf) y frecuencia acumulada en porcentaje (cf(%))

# GR�FICOS DE VARIABLES CONTINUAS

plot(dist, type="fh",col="blue",xlab="Intervalo de la variable


continua",main="PERIODO 951 - HISTOGRAMA FRECUENCIAS ABSOLUTAS") # HISTOGRAMA DE
FRECUENCIAS ABSOLUTAS
plot(dist, type="fp",col="blue",main="PERIODO 951 - POLIGONO FRECUENCIAS ABSOLUTAS
VARIABLE CONTINUA") #POLIGONO DE FRECUENCIAS ABSOLUTAS
plot(dist, type="rfh",col="blue",xlab="Intervalo variable conitnua",main="PERIODO
951 - HISTOGRAMA FRECUENCIAS RELATIVAS")#HISTOGRAMA DE FRECUENCIAS RELATIVAS

# Cuando ejecute el siguiente comando y le aparezca la gr�fica de "POLIGONO DE


FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE", por favor NO LA CIERRE
# Vuelva al c�digo ubicando el cursor en el marco azul de este (donde aparece el
nombre del c�digo), para que no pierda el orden que lleva en la ejecuci�n de los
comandos
# Los siguientes comandos que inician con la palabra "abline", crear�n l�neas sobre
la gr�fica que muestran informaci�n adicional sobre ella.
# Si cierra la gr�fica,cuando ejecute los comandos que inician con "abline" le
aparecer� el siguiente error:
# Error in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...) :
# plot.new has not been called yet

plot(dist, type="cfp",ylim=c(0,100), col="red",ylab="Frecuencia (%)",xlab="Variable


continua",main="PERIODO 951 - POL�GONO FRECUENCIAS RELATIVAS ACUMULADAS (%)")
#POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE
abline(h=25, col="black") # frecuencia = 25%
abline(h=50, col="red") # frecuencia = 50%
abline(h=75, col="blue") # frecuencia = 75%
abline(h=100, col="green") # frecuencia = 100%
abline(v=median(VARIABLECONTINUA), col="red") # mediana
abline(v=quantile(VARIABLECONTINUA, 0.25), col="black")# Cuantil Q1
abline(v=quantile(VARIABLECONTINUA, 0.5),col="red")# Cuantil Q2 (es la misma
mediana)
abline(v=quantile(VARIABLECONTINUA, 0.75),col="blue")# Cuantil Q3
abline(v=max(VARIABLECONTINUA), col="brown") # valor m�ximo

# Donde se unen las l�neas rojas es la mediana, lo cual indica que hay una
probabilidad del 50% de que los datos sean iguales o inferiores a esta.

#Distribuci�n emprica
ECDF=ecdf(VARIABLECONTINUA)
ECDF
minimos
maximos

# Al igual que con la gr�fica anterior, cuando ejecute el pr�ximo comando y le


aparezca la gr�fica "Distribuci�n emp�rica", por favor NO LA CIERRE
# Vuelva al c�digo ubicando el cursor en el marco azul de este (donde aparece el
nombre del c�digo), para que no pierda el orden que lleva en la ejecuci�n de los
comandos
# Los siguientes comandos que inician con la palabra "abline", crear�n l�neas sobre
la gr�fica que muestran informaci�n adicional sobre ella.
# Si cierra la gr�fica,cuando ejecute los comandos que inician con "abline" le
aparecer� un error.

# Gr�fico de Distribuci�n emp�rica:


plot(ECDF,col="red",lwd=3,xlab="VARIABLE CONTINUA",ylab="Distribuci�n
empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="PERIODO 951 - DISTRIBUCI�N
EMP�RICA")
abline(h=0.5, col="red") # la l�nea horizontal de color rojo, indica el
50% de la frecuencia de la variable
abline(v=median(VARIABLECONTINUA), col="red", ) # la l�nea vertical de color rojo
indica la mediana de la variable
median(VARIABLECONTINUA) # valor de la mediana en la variable elegida
abline(v=mean(VARIABLECONTINUA), col="blue", ) # la l�nea vertical de color azul
indica la media de la variable
mean(VARIABLECONTINUA) # valor de la media en la variable elegida
# �es igual o distinto el valor de la media y la mediana en la variable elegida?
# �c�mo se puede interpretar esta similitud o diferencia?

# C�LCULO DE PROBABILIDADES
# En el siguiente comando, indique el valor de la media de la variable elegida:
media= 2758.13
# Ahora indique el valor de la varianza de la variable elegida:
varianza= 151503.1
sigma=sqrt(varianza)

# Dentro del rango de valores de la variable elegida, indique aquel del que quiere
conocer su probabilidad.
# Reemplace el valor de 2700 por uno que se encuentre dentro del rango de datos en
el que se encuentra la variable que eligi�:

valor=2700
pnorm(valor,media,sigma)

# Indique en su informe el resultado de la probabilidad obtenida

# Presente todos los resultados solicitados en el informe de acuerdo a la gu�a de


la Fase 5

# Preparado por:

# Luis Alberto C�ceres


# Director de Curso

También podría gustarte