Está en la página 1de 16

Fase 5 –ejercicio final

Estadística Descriptiva
Luis Alberto Cáceres Torres

Javier Eduardo Cárdenas Lemus


Cedula: 1.116.544.754
Código: 300046_117

Programa: Agronomía

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESCUELA DE CIENCIAS AGRÍCOLAS, PECUARIAS


Y DEL MEDIO AMBIENTE

2021
agri_discreta

PERIODO 954 - FRECUENCIAS ABSOLUTAS - DISCRETA


30
25
Frecuencias absolutas

20
15
10
5
0

7 8 9 11 13 15 17 19 21 23
PERIODO 954 - FRECUENCIAS RELATIVAS - DISCRETA
0.12
0.10
Frecuencias relativas

0.08
0.06
0.04
0.02
0.00

7 8 9 11 13 15 17 19 21 23
PERIODO 954 - FRECUENCIAS RELATIVAS ACUMULADAS - DISCRETA
1.0
0.8
Frecuencias relativas

0.6
0.4
0.2
0.0

7 8 9 11 13 15 17 19 21 23
PERIODO 954 - HISTOGRAMA FRECUENCIAS ABSOLUTAS
50
40
Frequency

30
20
10
0

3.87 4.30 4.73 5.16 5.59 6.02 6.45 6.88 7.31 7.74

Intervalo de la variable continua


PERIODO 954 - POLIGONO FRECUENCIAS ABSOLUTAS VARIABLE CONTINUA
50
40
Frequency

30
20
10
0

3.87 4.30 4.73 5.16 5.59 6.02 6.45 6.88 7.31 7.74

Class limits

PERIODO 954 - POLÍGONO FRECUENCIAS RELATIVAS ACUMULADAS (%)


100
80
Frecuencia (%)

60
40
20
0

3.87 4.30 4.73 5.16 5.59 6.02 6.45 6.88 7.31 7.74

Variable continua
PERIODO 954 - DISTRIBUCIÓN EMPÍRICA
1.0
0.8
Distribución empirica

0.6
0.4
0.2
0.0

4 5 6 7

VARIABLE CONTINUA

PERIODO 954 - DISTRIBUCIÓN EMPÍRICA


1.0
0.8
Distribución empirica

0.6
0.4
0.2
0.0

4 5 6 7

VARIABLE CONTINUA

> # EJERCICIO FINAL PRUEBA OBJETIVA ABIERTA CURSO 300046A_954 - ESTADÍSTICA


DESCRIPTIVA (PARA AGRARIAS)
>

> # Cuando el volumen de información es alto, se pueden importar de una hoja de cálculo en
formato "*.csv"

> # Los datos con los que vamos a trabajar se encuentran en el archivo "Final.CSV"

> # Deben descargarlo y ubicar tanto la hoja de cálculo como este código en una misma
carpeta (se sugiere nombrarla: "Estadistica Descriptiva" )

> # No abra ni modifique el archivo, sólo guárdelo en la carpeta "Estadistica descriptiva"

>

>

># VARIABLE CUANTITATIVA DISCRETA

>

> # Recuerde que debe ubicarse en cada línea del código y digitar al mismo tiempo:
"Control+R" para ejecutar cada comando

> # No se salte ninguna línea porque puede aparecerle errores en la ejecución de los comandos

>

> getwd() # Debe aparecer la carpeta "Estadistica descriptiva" donde guardaron los
archivos "Script Fase 5 - Final.txt" y "Final.csv"

[1] "C:/Users/USUARIO/Desktop/fase5"

> # Si no les aparece la carpeta, el programa R no va a encontrar la base de datos y R mostrará


un mensaje de error al intentar abrirla

>

> PROBA=read.table("Final.csv",header=T,sep=";",dec=",")

> attach(PROBA) # Muestra los nombres de las variables sobre los cuales R va a hacer
los cálculos

>

> # Si el programa logró leer la hoja de cálculo Final.csv, con el siguiente comando le debe
aparecer:

>

> View(PROBA)

> # Ciérrela y continúe ejecutando el código

>

> # El grupo debe escoger entre los tres tipos de variables discretas existentes:

> # Para los estudiantes del área pecuaria, escriba: "Zoo_discreta"

> # Para los estudiantes del área agrícola, escriba: "Agri_discreta"


> # Para los estudiantes del área ambiental, escriba "Amb_discreta"

> # Si en el grupo hay estudiantes de distintos programas, deben ponerse de acuerdo para
escoger una sola variable con la que van a trabajar

>

> DISCRETA=Agri_discreta # En esta linea reemplaze la palabra "Agri_discreta" por la variable


seleccionada por el grupo

>

> # Si el grupo seleccionó "Agri_discreta" entonces la línea previa deberá quedar así:
DISCRETA=Agri_discreta

> # No debe reemplazar nada más, porque de lo contrario puede aparecerle algún error

>

> summary(DISCRETA)

Min. 1st Qu. Median Mean 3rd Qu. Max.

7.00 12.00 14.00 14.16 17.00 23.00

> table(DISCRETA) # Tabla de frecuencias absolutas

DISCRETA

7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

3 6 14 20 10 30 19 23 14 21 16 15 10 7 3 6 3

> fabs=table(DISCRETA) # Tabla de frecuencias absolutas

> fabs

DISCRETA

7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

3 6 14 20 10 30 19 23 14 21 16 15 10 7 3 6 3

> fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas

> fabsacum

7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

3 9 23 43 53 83 102 125 139 160 176 191 201 208 211 217 220

> frel=prop.table(table(DISCRETA)) # Tabla de frecuencias relativas

> frel

DISCRETA

7 8 9 10 11 12 13

0.01363636 0.02727273 0.06363636 0.09090909 0.04545455 0.13636364 0.08636364


14 15 16 17 18 19 20

0.10454545 0.06363636 0.09545455 0.07272727 0.06818182 0.04545455 0.03181818

21 22 23

0.01363636 0.02727273 0.01363636

> frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas

> frelacum

7 8 9 10 11 12 13

0.01363636 0.04090909 0.10454545 0.19545455 0.24090909 0.37727273 0.46363636

14 15 16 17 18 19 20

0.56818182 0.63181818 0.72727273 0.80000000 0.86818182 0.91363636 0.94545455

21 22 23

0.95909091 0.98636364 1.00000000

>

> # GRAFICOS PARA VARIABLES DISCRETAS

> barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 954 - FRECUENCIAS ABSOLUTAS -


DISCRETA") # Frecuencias absolutas

> barplot(frel,ylab="Frecuencias relativas",main="PERIODO 954 - FRECUENCIAS RELATIVAS -


DISCRETA") # Frecuencias relativas

> barplot(frelacum,ylab="Frecuencias relativas",main="PERIODO 954 - FRECUENCIAS


RELATIVAS ACUMULADAS - DISCRETA") #Frecuencias relativas acumuladas

>

> #PROBABILIDAD

>

> lambda=mean(DISCRETA)

>

> X <- 8 # ingrese el valor de X del que desee calcular su probabilidad

>

> dpois(X, lambda) # permite hallar la probabilidad de un valor X

[1] 0.02835884

> ppois(X, lambda) # permite hallar la probabilidad de un valor igual o menor a X

[1] 0.05724631

> 1-ppois(X, lambda) # permite hallar la probabilidad de un valor mayor a X


[1] 0.9427537

>

># VARIABLE CUANTITATIVA CONTINUA

>

> PROBA=read.table("Final.csv",header=T,sep=";",dec=",")

> attach(PROBA) # Muestra el nombre de las variables sobre los que el programa R
va a hacer los cálculos

The following objects are masked from PROBA (pos = 3):

Agri_continua, Agri_discreta, Amb_continua, Amb_discreta,

Zoo_continua, Zoo_discreta

>

> # Instalación del paquete "fdth"

> # Cuando aparezca el listado, elegir: "0-cloud [https]" y después: "fdth". hacer clic en "OK"

> # Esperar hasta que instale el paquete de comandos, puede tardar varios minutos

> # Esperar hasta que el cursor se vea de nuevo de color rojo en la parte de abajo de la Consola
R

>

> utils:::menuInstallPkgs() # seleccionar: "0-cloud [https]" y después: "fdth"

--- Please select a CRAN mirror for use in this session ---

probando la URL 'https://cloud.r-project.org/bin/windows/contrib/4.0/fdth_1.2-6.zip'

Content type 'application/zip' length 294862 bytes (287 KB)

downloaded 287 KB

package ‘fdth’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in

C:\Users\USUARIO\AppData\Local\Temp\RtmpYDVtUG\downloaded_packages

>

> library(fdth) # si se muestra en rojo en la Consola R, indica que se instaló correctamente


Attaching package: ‘fdth’

The following objects are masked from ‘package:stats’:

sd, var

Warning message:

package ‘fdth’ was built under R version 4.0.5

>

> # El grupo debe escoger entre los tres tipos de variables continuas existentes:

> # Para los estudiantes del área pecuaria, escriba: "Zoo_continua"

> # Para los estudiantes del área agrícola, escriba: "Agri_continua"

> # Para los estudiantes del área ambiental, escriba "Amb_continua"

> # Si en el grupo hay estudiantes de distintos programas, deben ponerse de acuerdo para
escoger una sola variable con la que van a trabajar

>

> CONTINUA=Agri_continua # En esta línea reemplace la palabra "Agri_continua" por la


variable seleccionada por el grupo

>

> # Si el grupo seleccionó "Agri_continua" entonces la línea previa deberá quedar así:
CONTINUA=Agri_continua

>

> summary(CONTINUA)

Min. 1st Qu. Median Mean 3rd Qu. Max.

3.910 5.200 5.935 5.882 6.522 7.660

> VARIANZA=var(CONTINUA)

> VARIANZA

[1] 0.7709453

> SIGMA=sd(CONTINUA)

> SIGMA

[1] 0.8780349

>
>

># TABLA DE FRECUENCIAS

>

> dist <- fdt(CONTINUA)

> dist# Esta tabla presenta el intervalo inferior y superior, la frecuencia absoluta (f), frecuencia
relativa (rf), frecuencia relativa en porcenaje (rf(%)), frecuencia acumulada (cf) y frecuencia
acumulada en porcentaje (cf(%))

Class limits f rf rf(%) cf cf(%)

[3.871,4.3) 7 0.03 3.18 7 3.18

[4.3,4.73) 14 0.06 6.36 21 9.55

[4.73,5.159) 29 0.13 13.18 50 22.73

[5.159,5.589) 36 0.16 16.36 86 39.09

[5.589,6.019) 30 0.14 13.64 116 52.73

[6.019,6.448) 43 0.20 19.55 159 72.27

[6.448,6.878) 28 0.13 12.73 187 85.00

[6.878,7.307) 21 0.10 9.55 208 94.55

[7.307,7.737) 12 0.05 5.45 220 100.00

>

># GRÁFICOS DE VARIABLES CONTINUAS

>

> plot(dist, type="fh",col="blue",xlab="Intervalo de la variable continua",main="PERIODO 954 -


HISTOGRAMA FRECUENCIAS ABSOLUTAS") # HISTOGRAMA DE FRECUENCIAS ABSOLUTAS

> plot(dist, type="fp",col="blue", lwd=2, main="PERIODO 954 - POLIGONO FRECUENCIAS


ABSOLUTAS VARIABLE CONTINUA") #POLIGONO DE FRECUENCIAS ABSOLUTAS

> plot(dist, type="rfh",col="blue",xlab="Intervalo variable conitnua",main="PERIODO 954 -


HISTOGRAMA FRECUENCIAS RELATIVAS")#HISTOGRAMA DE FRECUENCIAS RELATIVAS

>

> # Cuando ejecute el siguiente comando y le aparezca la gráfica de "POLIGONO DE


FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE", por favor NO LA CIERRE

> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece el nombre del
código), para que no pierda el orden que lleva en la ejecución de los comandos

> # Los siguientes comandos que inician con la palabra "abline", crearán líneas sobre la gráfica
que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le aparecerá el
siguiente error:

> # Error in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...) :

> # plot.new has not been called yet

>

>

> plot(dist, type="cfpp",ylim=c(0,100), col="brown",lwd=3, ylab="Frecuencia


(%)",xlab="Variable continua",main="PERIODO 954 - POLÍGONO FRECUENCIAS RELATIVAS
ACUMULADAS (%)") #POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE

> abline(h=25, col="black") # frecuencia = 25%

> abline(h=50, col="red") # frecuencia = 50%

> abline(h=75, col="black") # frecuencia = 75%

> abline(h=100, col="black") # frecuencia = 100%

> abline(v=mean(CONTINUA), col="red")# Media

> abline(v=quantile(CONTINUA, 0.25), col="blue")# Cuantil Q1

> abline(v=quantile(CONTINUA, 0.5),col="blue")# Cuantil Q2 (es la misma mediana)

> abline(v=quantile(CONTINUA, 0.75),col="blue")# Cuantil Q3

> abline(v=max(CONTINUA), col="blue") # valor máximo

>

> # Donde se une la línea roja horizontal con el gráfico, indica que en ese valor hay una
probabilidad del 50% de encontrar valores menores o iguales al indicado en el eje X.

>

> #Distribución emprica

> ECDF=ecdf(CONTINUA)

> ECDF

Empirical CDF

Call: ecdf(CONTINUA)

x[1:161] = 3.91, 3.92, 4.03, ..., 7.59, 7.66

> minimos<-min(CONTINUA)

> maximos<-max(CONTINUA)

>

> # Al igual que con la gráfica anterior, cuando ejecute el próximo comando y le aparezca la
gráfica "Distribución empírica", por favor NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece el nombre del
código), para que no pierda el orden que lleva en la ejecución de los comandos

> # Los siguientes comandos que inician con la palabra "abline", crearán líneas sobre la gráfica
que muestran información adicional sobre ella.

> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le aparecerá un
error.

>

> # GRÁFICO DE DISTRIBUCIÓN EMPÍRICA

>

> plot(ECDF,col="red",lwd=1,xlab="VARIABLE CONTINUA",ylab="Distribución


empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="PERIODO 954 - DISTRIBUCIÓN
EMPÍRICA")

> abline(h=0.5, col="red") # la línea horizontal de color rojo, indica el 50% de la frecuencia
de la variable

> abline(v=median(CONTINUA), col="red", ) # la línea vertical de color rojo indica la mediana


de la variable

> abline(v=mean(CONTINUA), col="blue", ) # la línea vertical de color azul indica la media de la


variable

>

>

># CÁLCULO DE PROBABILIDADES

>

> media= mean(CONTINUA)

> sigma=sd(CONTINUA)

>

> # Dentro del rango de valores de la variable elegida, indique aquel del que quiere conocer su
probabilidad.

>

> X<- 5 # Reemplace el valor X por aquel del que desea hallar la probabilidad

>

> pnorm(X,media,sigma) # probabilidad de hallar un valor igual o menor a X

[1] 0.1574528

>

> 1-pnorm(X,media,sigma) # probabilidad de hallar un valor mayor a X


[1] 0.8425472

>

>

> # Preparado por:

>

> # Luis Alberto Cáceres

> # Director de Curso

También podría gustarte