Está en la página 1de 4

# EJERCICIO FINAL PRUEBA OBJETIVA ABIERTA CURSO 300046 - ESTAD�STICA DESCRIPTIVA

(PARA AGRARIAS)

# Cuando el volumen de informaci�n es alto, se pueden importar de una hoja de


c�lculo en formato "*.csv"
# Los datos con los que vamos a trabajar se encuentran en el archivo
"PROBABILIDAD.CSV"
# Deben descargarlo y ubicar tanto la hoja de c�lculo como este c�digo en una misma
carpeta (se sugiere nombrarla: "Estadistica Descriptiva" )
# No abra ni modifique el archivo, s�lo gu�rdelo en la carpeta "Estadistica
descriptiva"

# Vaya al men� de R - "Archivo"


# D� click en "Cambiar dir" y ubique la carpeta "Estadistica descriptiva", donde
deben estar los archivos "CODIGOPROBABILIDAD.txt" y "PROBABILIDAD.csv"

# VARIABLE CUANTITATIVA DISCRETA

# Recuerde que debe ubicarse en cada l�nea del c�digo y digitar al mismo tiempo:
"Control+R" para ejecutar cada comando
# No se salte ninguna l�nea porque puede aparecerle errores en la ejecuci�n de los
comandos

getwd() # Debe aparecer la carpeta "Estadistica descriptiva" donde guardaron


los archivos "CODIGOPROBABILIDAD.txt" y "PROBABILIDAD.csv"
# Si no les aparece la carpeta, el programa R no va a encontrar la base de datos y
R mostrar� un mensaje de error al intentar abrirla

PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
attach(PROBA)
attach(PROBA) # Muestra los nombres de las variables sobre los cuales
R va a hacer los c�lculos
View(PROBA) # Muestra la tabla de Excel con los datos

# El grupo debe escoger entre los tres tipos de variables discretas existentes:
# Para los estudiantes de zootecnia, la variable "LECHONES", que es el n�mero de
lechones por cerda.
# Para los estudiantes de agronom�a, la variable "ACAROS", que es el n�mero de
�caros por hoja.
# Para los estudiantes de ambiental, la variable "HOGARES", que corresponde al
n�mero de hogares que reciclan en 100 barrios
# Si el n�mero del grupo es par, seleccionar una de las variables terminada en
n�mero par.
# Si el n�mero del grupo es impar, seleccionar una de las variables terminada en
n�mero impar.
# Si en el grupo hay estudiantes de distintos programas, deben ponerse de acuerdo
para escoger una sola variable con la que van a trabajar

CONTEO=LECHONES1 # En esta linea reemplaze la palabra "LECHONES1" por la variable


seleccionada por el grupo

# Si el grupo seleccion� "LECHONES7" entonces la l�nea previa deber� quedar as�:


CONTEO=LECHONES7
# No debe reemplazar nada m�s, porque de lo contrario puede aparecerle alg�n error

min(CONTEO)
max(CONTEO)
table(CONTEO) # Tabla de frecuencias absolutas
fabs=table(CONTEO) # Tabla de frecuencias absolutas
fabs
fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas
fabsacum
frel=prop.table(table(CONTEO)) # Tabla de frecuencias relativas
frel
frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
frelacum

# GRAFICOS PARA VARIABLES DISCRETAS


barplot(fabs,ylab="Frecuencias absolutas",main="Gr�fico de barras CONTEO") #
Frecuencias absolutas
barplot(frel,ylab="Frecuencias relativas",main="FRECUENCIAS RELATIVAS CONTEO") #
Frecuencias relativas
barplot(frelacum,ylab="Frecuencias relativas",main="FRECUENCIAS RELATIVAS
ACUMULADAS CONTEO") #Frecuencias relativas acumuladas

# VARIABLE CUANTITATIVA CONTINUA

PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
attach(PROBA) # Muestra el nombre de las variables sobre los que
el programa R va a hacer los c�lculos
attach(PROBA)

# Instalaci�n del paquete "fdth"


# Cuando aparezca el listado, elegir: "fdth"
# Esperar hasta que instale el paquete de comandos, puede tardar varios minutos
# Esperar hasta que el cursor se vea de nuevo de color rojo en la parte de abajo de
la Consola R

utils:::menuInstallPkgs() # seleccionar: "USA(IA)" y posteriormente: "fdth"

library(fdth) # si se pone en rojo, significa que qued� correctamente


instalada la librer�a fdth

# El grupo debe escoger entre los tres tipos de variables continuas existentes:
# Para los estudiantes de zootecnia, la variable "PESOCON", que es el peso de
conejos.
# Para los estudiantes de agronom�a, la variable "pH", que es el potencial de
hidr�geno del suelo.
# Para los estudiantes de ambiental, la variable "PM", que corresponde al material
particulado de 2.5
# Si el n�mero del grupo es par, seleccionar una de las variables terminada en
n�mero par.
# Si el n�mero del grupo es impar, seleccionar una de las variables terminada en
n�mero impar.
# Si en el grupo hay estudiantes de distintos programas, deben ponerse de acuerdo
para escoger una sola variable con la que van a trabajar

VARIABLECONTINUA=PESOCON0 # En esta linea reemplaze la palabra "PESOCON0" por la


variable seleccionada por el grupo

# Si el grupo seleccion� "PM8" entonces la l�nea previa deber� quedar as�:


VARIABLECONTINUA=PM8

summary(VARIABLECONTINUA)
minimos=min(VARIABLECONTINUA)
minimos
maximos=max(VARIABLECONTINUA)
maximos
median(VARIABLECONTINUA)
VARIANZA=var(VARIABLECONTINUA)
VARIANZA
sd(VARIABLECONTINUA)
SIGMA=sqrt(VARIANZA)
SIGMA
length(VARIABLECONTINUA)

# TABLA DE FRECUENCIAS

dist <- fdt(VARIABLECONTINUA)


dist # Esta tabla presenta el intervalo inferior y superior, la
frecuencia absoluta (f), frecuencia relativa (rf), frecuencia relativa en porcenaje
(rf(%)), frecuencia acumulada (cf) y frecuencia acumulada en porcentaje (cf(%))

# GR�FICOS DE VARIABLES CONTINUAS

plot(dist, type="fh",col="blue",main="HISTOGRAMA DE FRECUENCIAS ABSOLUTAS") #


HISTOGRAMA DE FRECUENCIAS ABSOLUTAS
plot(dist, type="fp",col="blue",main="POLIGONO DE FRECUENCIAS ABSOLUTAS") #POLIGONO
DE FRECUENCIAS ABSOLUTAS
plot(dist, type="rfh",col="blue",main="HISTOGRAMA DE FRECUENCIAS
RELATIVAS")#HISTOGRAMA DE FRECUENCIAS RELATIVAS
plot(dist, type="cfp",ylim=c(0,100), col="red",main="POLIGONO DE FRECUENCIAS
RELATIVAS ACUMULADAS EN PORCENTAJE") #POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS
EN PORCENTAJE
abline(h=25, col="black") # frecuencia = 25%
abline(h=50, col="red") # frecuencia = 50%
abline(h=75, col="blue") # frecuencia = 75%
abline(h=100, col="green") # frecuencia = 100%
abline(v=median(VARIABLECONTINUA), col="red") # mediana
abline(v=quantile(VARIABLECONTINUA, 0.25), col="black")# Cuantil Q1
abline(v=quantile(VARIABLECONTINUA, 0.5),col="red")# Cuantil Q2 (es la misma
mediana)
abline(v=quantile(VARIABLECONTINUA, 0.75),col="blue")# Cuantil Q3
abline(v=max(VARIABLECONTINUA), col="brown") # valor m�ximo

# Donde se unen las l�neas rojas es la mediana, lo cual indica que hay una
probabilidad del 50% de que los datos sean iguales o inferiores a esta.

#Distribuci�n emprica
ECDF=ecdf(VARIABLECONTINUA)
ECDF
minimos
maximos
plot(ECDF,col="red",lwd=3,xlab="VARIABLECONTINUA",ylab="Distribuci�n
empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="Distribuci�n empirica")
# Gr�fico de Distribuci�n emp�rica
abline(h=0.5, col="red") # la l�nea horizontal de color rojo, indica el
50% de la frecuencia de la variable
abline(v=median(VARIABLECONTINUA), col="red", ) # la l�nea vertical de color rojo
indica la mediana de la variable
median(VARIABLECONTINUA) # valor de la mediana en la variable elegida
abline(v=mean(VARIABLECONTINUA), col="blue", ) # la l�nea vertical de color azul
indica la media de la variable
mean(VARIABLECONTINUA) # valor de la media en la variable elegida
# �es igual o distinto el valor de la media y la mediana en la variable elegida?
# �c�mo se puede interpretar esta similitud o diferencia?

# C�LCULO DE PROBABILIDADES
# En el siguiente comando, indique el valor de la media de la variable elegida:
media= 2758.13
# Ahora indique el valor de la varianza de la variable elegida:
varianza= 151503.1
sigma=sqrt(varianza)

# Dentro del rango de valores presente en la variable elegida, indique aquel del
que quiere conocer su probabilidad:
valor=2700
pnorm(valor,media,sigma)

# Indique en su informe el resultado de la probabilidad obtenida

# Presente todos los resultados solicitados en el informe de acuerdo a la gu�a de


la Fase 5

# Preparado por:

# Luis Alberto C�ceres


# Director de Curso

También podría gustarte