Está en la página 1de 4

# EJERCICIO FINAL PRUEBA OBJETIVA ABIERTA CURSO 300046A_764 - ESTAD?

STICA
DESCRIPTIVA (PARA AGRARIAS)

# Cuando el volumen de informaci?n es alto, se pueden importar de una hoja de c?


lculo en formato "*.csv"
# Los datos con los que vamos a trabajar se encuentran en el archivo
"PROBABILIDAD.CSV"
# Deben descargarlo y ubicar tanto la hoja de c?lculo como este c?digo en una misma
carpeta (se sugiere nombrarla: "Estadistica Descriptiva" )
# No abra ni modifique el archivo, s?lo gu?rdelo en la carpeta "Estadistica
descriptiva"

# Vaya al men? de R - "Archivo"


# D? click en "Cambiar dir" y ubique la carpeta "Estadistica descriptiva", donde
deben estar los archivos "CODIGOPROBABILIDAD.txt" y "PROBABILIDAD.csv"

# VARIABLE CUANTITATIVA DISCRETA

# Recuerde que debe ubicarse en cada l?nea del c?digo y digitar al mismo tiempo:
"Control+R" para ejecutar cada comando
# No se salte ninguna l?nea porque puede aparecerle errores en la ejecuci?n de los
comandos

getwd() # Debe aparecer la carpeta "Estadistica descriptiva" donde guardaron


los archivos "CODIGOPROBABILIDAD.txt" y "PROBABILIDAD.csv"
# Si no les aparece la carpeta, el programa R no va a encontrar la base de datos y
R mostrar? un mensaje de error al intentar abrirla

PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
attach(PROBA)
attach(PROBA) # Muestra los nombres de las variables sobre los cuales
R va a hacer los c?lculos

# Si el programa logr? leer la hoja de c?lculo PROBABILIDAD.csv, con el siguiente


comando le debe aparecer:
# Ci?rrela y contin?e ejecutando el c?digo

View(PROBA)

# El grupo debe escoger entre los tres tipos de variables discretas existentes:
# Para los estudiantes de zootecnia, la variable "LECHONES", que es el n?mero de
lechones por cerda.
# Para los estudiantes de agronom?a, la variable "ACAROS", que es el n?mero de ?
caros por hoja.
# Para los estudiantes de ambiental, la variable "HOGARES", que corresponde al n?
mero de hogares que reciclan en 100 barrios
# Si el n?mero del grupo es par, seleccionar la variable terminada en n?mero par.
# Si el n?mero del grupo es impar, seleccionar la variable terminada en n?mero
impar.
# Si en el grupo hay estudiantes de distintas profesiones, deben ponerse de acuerdo
para escoger una sola variable con la que van a trabajar

CONTEO=HOGARES1 # En esta linea reemplaze la palabra "LECHONES1" por la variable


seleccionada por el grupo

# Si el grupo seleccion? "HOGARES2" entonces la l?nea previa deber? quedar as?:


CONTEO=HOGARES2
# No debe reemplazar nada m?s, porque de lo contrario puede aparecerle alg?n error
min(CONTEO)
max(CONTEO)
table(CONTEO) # Tabla de frecuencias absolutas
fabs=table(CONTEO) # Tabla de frecuencias absolutas
fabs
fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas
fabsacum
frel=prop.table(table(CONTEO)) # Tabla de frecuencias relativas
frel
frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
frelacum

# GRAFICOS PARA VARIABLES DISCRETAS


barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 764 - FRECUENCIAS ABSOLUTAS
- DISCRETA") # Frecuencias absolutas

barplot(frel,ylab="Frecuencias relativas",main="PERIODO 764 - FRECUENCIAS RELATIVAS


- DISCRETA") # Frecuencias relativas
barplot(frelacum,ylab="Frecuencias relativas",main="PERIODO 764 - FRECUENCIAS
RELATIVAS ACUMULADAS - DISCRETA") #Frecuencias relativas acumuladas

# VARIABLE CUANTITATIVA CONTINUA

PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
attach(PROBA) # Muestra el nombre de las variables sobre los que
el programa R va a hacer los c?lculos

# Instalaci?n del paquete "fdth"


# Cuando aparezca el listado, elegir: "USA(IA)" y despu?s: "fdth". hacer clic en
"OK"
# Esperar hasta que instale el paquete de comandos, puede tardar varios minutos
# Esperar hasta que el cursor se vea de nuevo de color rojo en la parte de abajo de
la Consola R

utils:::menuInstallPkgs() # seleccionar el primero de la lista: "0-Cloud [https]"


y despu?s el paquete: "fdth"

library(fdth) # si se muestra en rojo en la Consola R, indica que se instal?


correctamente

# El grupo debe escoger entre los tres tipos de variables continuas existentes:
# Para los estudiantes de zootecnia, la variable "PESOCON", que es el peso de
conejos.
# Para los estudiantes de agronom?a, la variable "pH", que es el potencial de hidr?
geno del suelo.
# Para los estudiantes de ambiental, la variable "PM", que corresponde al material
particulado de 2.5
# Si el n?mero del grupo es par, seleccionar una la variable terminada en n?mero
par.
# Si el n?mero del grupo es impar, seleccionar la variable terminada en n?mero par.
# Si en el grupo hay estudiantes de distintas profesiones, deben ponerse de acuerdo
para escoger una sola variable con la que van a trabajar

VARIABLECONTINUA=PM1 # En esta linea reemplaze la palabra "PESOCON0" por la


variable seleccionada por el grupo

# Si el grupo seleccion? "PM8" entonces la l?nea previa deber? quedar as?:


VARIABLECONTINUA=PM8

summary(VARIABLECONTINUA)
minimos=min(VARIABLECONTINUA)
minimos
maximos=max(VARIABLECONTINUA)
maximos
mean(VARIABLECONTINUA)
median(VARIABLECONTINUA)
VARIANZA=var(VARIABLECONTINUA)
VARIANZA
sd(VARIABLECONTINUA)
SIGMA=sqrt(VARIANZA)
SIGMA
length(VARIABLECONTINUA)

# TABLA DE FRECUENCIAS

dist <- fdt(VARIABLECONTINUA)


dist # Esta tabla presenta el intervalo inferior y superior, la
frecuencia absoluta (f), frecuencia relativa (rf), frecuencia relativa en porcenaje
(rf(%)), frecuencia acumulada (cf) y frecuencia acumulada en porcentaje (cf(%))

# GR?FICOS DE VARIABLES CONTINUAS

plot(dist, type="fh",col="blue",xlab="Intervalo de la variable


continua",main="PERIODO 764 - HISTOGRAMA FRECUENCIAS ABSOLUTAS") # HISTOGRAMA DE
FRECUENCIAS ABSOLUTAS
plot(dist, type="fp",col="blue",main="PERIODO 764 - POLIGONO FRECUENCIAS ABSOLUTAS
VARIABLE CONTINUA") #POLIGONO DE FRECUENCIAS ABSOLUTAS
plot(dist, type="rfh",col="blue",xlab="Intervalo variable conitnua",main="PERIODO
764 - HISTOGRAMA FRECUENCIAS RELATIVAS")#HISTOGRAMA DE FRECUENCIAS RELATIVAS

# Cuando ejecute el siguiente comando y le aparezca la gr?fica de "POLIGONO DE


FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE", por favor NO LA CIERRE
# Vuelva al c?digo ubicando el cursor en el marco azul de este (donde aparece el
nombre del c?digo), para que no pierda el orden que lleva en la ejecuci?n de los
comandos
# Los siguientes comandos que inician con la palabra "abline", crear?n l?neas sobre
la gr?fica que muestran informaci?n adicional sobre ella.
# Si cierra la gr?fica,cuando ejecute los comandos que inician con "abline" le
aparecer? el siguiente error:
# Error in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...) :
# plot.new has not been called yet

plot(dist, type="cfp",ylim=c(0,100), col="red",ylab="Frecuencia (%)",xlab="Variable


continua",main="PERIODO 764 - POL?GONO FRECUENCIAS RELATIVAS ACUMULADAS (%)")
#POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE
abline(h=25, col="black") # frecuencia = 25%
abline(h=50, col="red") # frecuencia = 50%
abline(h=75, col="blue") # frecuencia = 75%
abline(h=100, col="green") # frecuencia = 100%
abline(v=median(VARIABLECONTINUA), col="red") # mediana
abline(v=quantile(VARIABLECONTINUA, 0.25), col="black")# Cuantil Q1
abline(v=quantile(VARIABLECONTINUA, 0.5),col="red")# Cuantil Q2 (es la misma
mediana)
abline(v=quantile(VARIABLECONTINUA, 0.75),col="blue")# Cuantil Q3
abline(v=max(VARIABLECONTINUA), col="brown") # valor m?ximo
# Donde se unen las l?neas rojas es la mediana, lo cual indica que hay una
probabilidad del 50% de que los datos sean iguales o inferiores a esta.

#Distribuci?n emprica
ECDF=ecdf(VARIABLECONTINUA)
ECDF
minimos
maximos

# Al igual que con la gr?fica anterior, cuando ejecute el pr?ximo comando y le


aparezca la gr?fica "Distribuci?n emp?rica", por favor NO LA CIERRE
# Vuelva al c?digo ubicando el cursor en el marco azul de este (donde aparece el
nombre del c?digo), para que no pierda el orden que lleva en la ejecuci?n de los
comandos
# Los siguientes comandos que inician con la palabra "abline", crear?n l?neas sobre
la gr?fica que muestran informaci?n adicional sobre ella.
# Si cierra la gr?fica,cuando ejecute los comandos que inician con "abline" le
aparecer? un error.

# Gr?fico de Distribuci?n emp?rica:


plot(ECDF,col="red",lwd=3,xlab="VARIABLE CONTINUA",ylab="Distribuci?n
empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="PERIODO 764 - DISTRIBUCI?N EMP?
RICA")
abline(h=0.5, col="red") # la l?nea horizontal de color rojo, indica el
50% de la frecuencia de la variable
abline(v=median(VARIABLECONTINUA), col="red", ) # la l?nea vertical de color rojo
indica la mediana de la variable
median(VARIABLECONTINUA) # valor de la mediana en la variable elegida
abline(v=mean(VARIABLECONTINUA), col="blue", ) # la l?nea vertical de color azul
indica la media de la variable

# C?LCULO DE PROBABILIDADES

# En el siguiente comando, indique el valor de la media de la variable elegida:


media= 18.52
# Ahora indique el valor de la varianza de la variable elegida:
varianza= 33.14101
sigma=sqrt(varianza)

# Dentro del rango de valores de la variable elegida, indique aquel del que quiere
conocer su probabilidad.
# Reemplace el valor de 2700 por uno que se encuentre dentro del rango de datos en
el que se encuentra la variable que eligi?:

valor=29
pnorm(valor,media,sigma)
1-pnorm(valor,media,sigma)

# Responda a todas las preguntas solicitadas en la gu?a de la Fase 5

# Preparado por:

# Luis Alberto C?ceres


# Director de Curso

También podría gustarte