Está en la página 1de 24

DESARROLLO DE ACTIVIDAD

Presentar la siguiente información:


3.1. VARIABLE CUANTITATIVA DISCRETA
3.1.1. Indicar el nombre de la variable discreta elegida y presentar: Para el desarrollo de
este trabajo hemos seleccionado la variable agrícola

• Tabla de Frecuencias Absolutas


FRECUENCIAS

VALOR ABSOLUTAS

7 3

8 6

9 14

10 20

11 10

12 30

13 19

14 23

15 14

16 21

17 16

18 15

19 10

20 7

21 3

22 6
23 3

Total 220

• Tabla de Frecuencias Absolutas Acumuladas


FRECUENCIAS

ABSOLUTAS

VALOR ACUMULADAS

7 3

8 9

9 23

10 43

11 53

12 83

13 102

14 125

15 139

16 160

17 176

18 191

19 201

20 208

21 211

22 217

23 220

• Tabla de Frecuencias Relativas


FRECUENCIA

VALOR RELATIVA

7 0,01363636

8 0,02727273

9 0,06363636

10 0,09090909

11 0,04545455

12 0,13636364

13 0,08636364

14 0,10454545

15 0,06363636

16 0,09545455

17 0,07272727

18 0,06818182

19 0,04545455

20 0,03181818

21 0,01363636

22 0,02727273

23 0,01363636

Total 1

• Tabla de Frecuencias Relativas Acumuladas


frecuencias

relativas

valor acumuladas

7 0,01363636
8 0,04090909

9 0,10454545

10 0,19545454

11 0,24090909

12 0,37727273

13 0,46363637

14 0,56818182

15 0,63181818

16 0,72727273

17 0,80000000

18 0,86818182

19 0,91363637

20 0,94545455

21 0,95909091

22 0,98636364

23 1,00000000

3.1.2. Presentar los siguientes gráficos con su respectiva descripción y análisis


de la información presentada en cada uno de ellos:
• Gráfico de Frecuencias Absolutas

PERIODO 954 - FRECUENCIAS ABSOLUTAS - DISCRETA


30
25
Frecuencias absolutas

20
15
10
5
0

7 8 9 11 13 15 17 19 21 23

• Gráfico de Frecuencias Relativas

PERIODO 954 - FRECUENCIAS RELATIVAS - DISCRETA


0.12
0.10
Frecuencias relativas

0.08
0.06
0.04
0.02
0.00

7 8 9 11 13 15 17 19 21 23
• Gráfico de Frecuencias Relativas Acumuladas

PERIODO 954 - FRECUENCIAS RELATIVAS ACUMULADAS - DISCRETA


1.0
0.8
Frecuencias relativas

0.6
0.4
0.2
0.0

7 8 9 11 13 15 17 19 21 23

3.1.3. Responda la siguiente pregunta:


De acuerdo con lo observado en la gráfica de Frecuencias Relativas de la variable
discreta ¿el comportamiento de la variable se asemeja a una distribución normal?
Explique su respuesta.
3.2. VARIABLE CUANTITATIVA CONTINUA
3.2.1. Indicar el nombre de la variable continúa elegida y presentar:
Variable Agrícola

VALOR
Nombre de la variable elegida Variables agrícolas
Valor Mínimo 3.910
Valor máximo 7.660
Media 5.882
Mediana 5.935
Varianza 0.7709453
Desviación estándar 0.8780349
Tabla resumen indicando:

Frecuencia Frecuencia
Intervalo de Frecuencia Frecuencia absoluta acumulada Frecuencia
datos absoluta relativa acumulada en % relativa %
3.871 - 4.3 7 0.03 7 3.18 3.18
4.3 - 4.73 14 0.06 21 9.55 6.36
4.73 - 5.159 29 0.13 50 22.73 13.18
5.159 - 5.589 36 0.16 86 39.09 16.36
5.589 - 6.019 30 0.14 116 52.73 13.64
6.019 - 6.448 43 0.20 159 72.27 19.55
6.448 - 6.878 28 0.13 187 85.00 12.73
6.878 - 7.307 21 0.10 208 94.55 9.55
7.307 - 7.737 12 0.05 220 100 5.45

3.2.2. Presente los siguientes gráficos, haciendo una descripción de cada uno
de ellos y analice los resultados obtenidos:
• "HISTOGRAMA DE FRECUENCIAS ABSOLUTAS"

En este intervalo puedo observar que el intervalo mayor es de 6.02 - 6.45, el cual es el
sexto intervalo, con una frecuencia de 43, que el primer intervalo es el primero con una
frecuencia de 7 y no observo datos atípicos.
• "POLIGONO DE FRECUENCIAS ABSOLUTAS"

Puedo observar que son los mismos datos del histograma anterior, encontramos los
mismos intervalos y la misma frecuencia.

• "HISTOGRAMA DE FRECUENCIAS RELATIVAS"


En este histograma puedo apreciar que el mayor intervalo es el sexto con un valor de
6.02 - 6.45, con una frecuencia 19.55%
También encontramos el intervalo con menor frecuencia es el primer intervalo con una
frecuencia de 7.
• "POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS EN
PORCENTAJE"

Observando el polígono se puede deducir que cuartiles 1, 2 y 3 están relativamente


cerca, lo que confirma lo analizado con anterioridad donde se mencionaba que la
distribución de datos tiende a estar cerca a la media.
• "DISTRIBUCIÓN EMPÍRICA"

Puedo observar que la variable continúa inicia en cero y aumenta de una manera
consecutiva hasta llegar a 1.0.

3.3. Con los resultados obtenidos al ejecutar el script, el director de curso proporcionará
en el foro de discusión tres cuestionarios (uno con enfoque agrícola, otro con enfoque
pecuario y otro con enfoque ambiental). Cada grupo deberá elegir uno de los tres, de
acuerdo con el programa de estudio que predomine en el grupo y resolverlo.
Variable discreta: número de frutos (Agri_discreta)
En un cultivo de tomate de árbol, se realizó un muestreo determinando el número de
frutos por árbol que, de acuerdo con su grado de maduración, estarían listos a ser
cosechados dentro de un mes. Si la plantación tiene 2000 árboles:
1.1. ¿Cuál es la probabilidad de obtener una cosecha de al menos 24.000 frutos?
1.2. ¿Cuál es la probabilidad de obtener una cosecha menor o igual a 28.000 frutos?
1.3. ¿Cuál es la probabilidad de obtener una cosecha exacta de 30.000 frutos?
1.4. ¿Qué modelo de distribución se debe usar en este caso para el cálculo de
probabilidades?
Explique su respuesta.
2. Variable continua: pH (Agri_continua)
Se desea sembrar banano en 100 hectáreas, para ello, previamente se realizó una
muestra de suelo por hectárea y se determinó el pH.
2.1. De acuerdo con el pH óptimo para la siembra de banano, ¿considera que el suelo
analizado
es adecuado para su cultivo?
2.2. ¿Cuál es la probabilidad de hallar un valor de pH mayor de 5?0?
2.3. Si el pH óptimo para la siembra de banano se encontrara entre 5.5 y 7.5, ¿cuál es la
probabilidad de que las muestras analizadas se encuentren dentro de este rango?
No olvide incluir en la bibliografía los documentos consultados en los que se apoyó
para hacer sus recomendaciones.
CONCLUSIÓN
BIBLIOGRAFIA
Copia de los resultados obtenidos al ejecutar el script en la consola de resultados
del programa R

> # EJERCICIO FINAL PRUEBA OBJETIVA ABIERTA CURSO 300046A_954 -


ESTADÍSTICA DESCRIPTIVA (PARA AGRARIAS)
>
> # Cuando el volumen de información es alto, se pueden importar de una hoja
de cálculo en formato "*.csv"
> # Los datos con los que vamos a trabajar se encuentran en el archivo
"Final.CSV"
> # Deben descargarlo y ubicar tanto la hoja de cálculo como este código en
una misma carpeta (se sugiere nombrarla: "Estadistica Descriptiva" )
> # No abra ni modifique el archivo, sólo guárdelo en la carpeta "Estadistica
descriptiva"
>
>
># VARIABLE CUANTITATIVA DISCRETA
>
> # Recuerde que debe ubicarse en cada línea del código y digitar al mismo
tiempo: "Control+R" para ejecutar cada comando
> # No se salte ninguna línea porque puede aparecerle errores en la ejecución
de los comandos
>
> getwd() # Debe aparecer la carpeta "Estadistica descriptiva" donde
guardaron los archivos "Script Fase 5 - Final.txt" y "Final.csv"
[1] "C:/Users/gbeta/Downloads/ESTADISTICA DESCRIPTIVA DICIEMBRE"
> # Si no les aparece la carpeta, el programa R no va a encontrar la base de
datos y R mostrará un mensaje de error al intentar abrirla
>
> PROBA=read.table("Final.csv",header=T,sep=";",dec=",")
> attach(PROBA) # Muestra los nombres de las variables sobre los
cuales R va a hacer los cálculos
>
> # Si el programa logró leer la hoja de cálculo Final.csv, con el siguiente
comando le debe aparecer:
>
> View(PROBA)
> # Ciérrela y continúe ejecutando el código
>
> # El grupo debe escoger entre los tres tipos de variables discretas existentes:
> # Para los estudiantes de zootecnia, la variable "Zoo_discreta", que es el
número de lechones por cerda.
> # Para los estudiantes de agronomía, la variable "Agri_discreta", que es el
número de ácaros por hoja.
> # Para los estudiantes de ambiental, la variable "Amb_discreta", que
corresponde al número de hogares que reciclan en 100 barrios
> # Si en el grupo hay estudiantes de distintos programas, deben ponerse de
acuerdo para escoger una sola variable con la que van a trabajar
>
> DISCRETA=Agri_discreta # En esta linea reemplaze la palabra
"Agri_discreta" por la variable seleccionada por el grupo
>
> # Si el grupo seleccionó "Agri_discreta" entonces la línea previa deberá
quedar así: CONTEO=Agri_discreta
> # No debe reemplazar nada más, porque de lo contrario puede aparecerle
algún error
>
> summary(DISCRETA)
Min. 1st Qu. Median Mean 3rd Qu. Max.
7.00 12.00 14.00 14.16 17.00 23.00
> table(DISCRETA) # Tabla de frecuencias absolutas
DISCRETA
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
3 6 14 20 10 30 19 23 14 21 16 15 10 7 3 6 3
> fabs=table(DISCRETA) # Tabla de frecuencias absolutas
> fabs
DISCRETA
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
3 6 14 20 10 30 19 23 14 21 16 15 10 7 3 6 3
> fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas
> fabsacum
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
3 9 23 43 53 83 102 125 139 160 176 191 201 208 211 217 220
> frel=prop.table(table(DISCRETA)) # Tabla de frecuencias relativas
> frel
DISCRETA
7 8 9 10 11 12 13
0.01363636 0.02727273 0.06363636 0.09090909 0.04545455 0.13636364
0.08636364
14 15 16 17 18 19 20
0.10454545 0.06363636 0.09545455 0.07272727 0.06818182 0.04545455
0.03181818
21 22 23
0.01363636 0.02727273 0.01363636
> frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
> frelacum
7 8 9 10 11 12 13
0.01363636 0.04090909 0.10454545 0.19545455 0.24090909 0.37727273
0.46363636
14 15 16 17 18 19 20
0.56818182 0.63181818 0.72727273 0.80000000 0.86818182 0.91363636
0.94545455
21 22 23
0.95909091 0.98636364 1.00000000
>
> # GRAFICOS PARA VARIABLES DISCRETAS
> barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 954 -
FRECUENCIAS ABSOLUTAS - DISCRETA") # Frecuencias absolutas
> barplot(frel,ylab="Frecuencias relativas",main="PERIODO 954 -
FRECUENCIAS RELATIVAS - DISCRETA") # Frecuencias relativas
> barplot(frelacum,ylab="Frecuencias relativas",main="PERIODO 954 -
FRECUENCIAS RELATIVAS ACUMULADAS - DISCRETA") #Frecuencias
relativas acumuladas
>
> #PROBABILIDAD
>
> lambda=mean(DISCRETA)
>
> X <- 40 # ingrese el valor de X del que desee calcular su probabilidad
>
> dpois(X, lambda) # permite hallar la probabilidad de un valor X
[1] 9.641765e-09
> ppois(X, lambda) # permite hallar la probabilidad de un valor igual o menor a
X
[1] 1
> 1-ppois(X, lambda) # permite hallar la probabilidad de un valor mayor a X
[1] 4.997055e-09
>
># VARIABLE CUANTITATIVA CONTINUA
>
> PROBA=read.table("Final.csv",header=T,sep=";",dec=",")
> attach(PROBA) # Muestra el nombre de las variables sobre los
que el programa R va a hacer los cálculos
The following objects are masked from PROBA (pos = 3):

Agri_continua, Agri_discreta, Amb_continua, Amb_discreta,


Zoo_continua, Zoo_discreta

>
> # Instalación del paquete "fdth"
> # Cuando aparezca el listado, elegir: "0-cloud [https]" y después: "fdth". hacer
clic en "OK"
> # Esperar hasta que instale el paquete de comandos, puede tardar varios
minutos
> # Esperar hasta que el cursor se vea de nuevo de color rojo en la parte de
abajo de la Consola R
>
> utils:::menuInstallPkgs() # seleccionar: "0-cloud [https]" y después: "fdth"
--- Please select a CRAN mirror for use in this session ---
probando la URL 'https://cloud.r-project.org/bin/windows/contrib/4.1/fdth_1.2-
6.zip'
Content type 'application/zip' length 295062 bytes (288 KB)
downloaded 288 KB

package ‘fdth’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in


C:\Users\gbeta\AppData\Local\Temp\Rtmpcz3OkY\downloaded_packages
>
> library(fdth) # si se muestra en rojo en la Consola R, indica que se instaló
correctamente

Attaching package: ‘fdth’

The following objects are masked from ‘package:stats’:

sd, var

Warning message:
package ‘fdth’ was built under R version 4.1.2
>
> # El grupo debe escoger entre los tres tipos de variables continuas
existentes:
> # Para los estudiantes de zootecnia, la variable "Zoo_continua", que es el
peso de conejos.
> # Para los estudiantes de agronomía, la variable "Agri_continua", que es el
potencial de hidrógeno del suelo.
> # Para los estudiantes de ambiental, la variable "Amb_continua", que
corresponde al material particulado de 2.5
> # Si en el grupo hay estudiantes de distintos programas, deben ponerse de
acuerdo para escoger una sola variable con la que van a trabajar
>
> CONTINUA=Agri_continua # En esta linea reemplace la palabra
"Agri_continua" por la variable seleccionada por el grupo
>
> # Si el grupo seleccionó "Agri_continua" entonces la línea previa deberá
quedar así: VARIABLECONTINUA=Agri_continua
>
> summary(CONTINUA)
Min. 1st Qu. Median Mean 3rd Qu. Max.
3.910 5.200 5.935 5.882 6.522 7.660
> VARIANZA=var(CONTINUA)
> VARIANZA
[1] 0.7709453
> SIGMA=sd(CONTINUA)
> SIGMA
[1] 0.8780349
>
>
># TABLA DE FRECUENCIAS
>
> dist <- fdt(CONTINUA)
> dist# Esta tabla presenta el intervalo inferior y superior, la frecuencia absoluta
(f), frecuencia relativa (rf), frecuencia relativa en porcenaje (rf(%)), frecuencia
acumulada (cf) y frecuencia acumulada en porcentaje (cf(%))
Class limits f rf rf(%) cf cf(%)
[3.871,4.3) 7 0.03 3.18 7 3.18
[4.3,4.73) 14 0.06 6.36 21 9.55
[4.73,5.159) 29 0.13 13.18 50 22.73
[5.159,5.589) 36 0.16 16.36 86 39.09
[5.589,6.019) 30 0.14 13.64 116 52.73
[6.019,6.448) 43 0.20 19.55 159 72.27
[6.448,6.878) 28 0.13 12.73 187 85.00
[6.878,7.307) 21 0.10 9.55 208 94.55
[7.307,7.737) 12 0.05 5.45 220 100.00
>
># GRÁFICOS DE VARIABLES CONTINUAS
>
> plot(dist, type="fh",col="blue",xlab="Intervalo de la variable
continua",main="PERIODO 954 - HISTOGRAMA FRECUENCIAS
ABSOLUTAS") # HISTOGRAMA DE FRECUENCIAS ABSOLUTAS
> plot(dist, type="fp",col="blue", lwd=2, main="PERIODO 954 - POLIGONO
FRECUENCIAS ABSOLUTAS VARIABLE CONTINUA") #POLIGONO DE
FRECUENCIAS ABSOLUTAS
> plot(dist, type="rfh",col="blue",xlab="Intervalo variable
conitnua",main="PERIODO 954 - HISTOGRAMA FRECUENCIAS
RELATIVAS")#HISTOGRAMA DE FRECUENCIAS RELATIVAS
>
> # Cuando ejecute el siguiente comando y le aparezca la gráfica de
"POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS EN
PORCENTAJE", por favor NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde
aparece el nombre del código), para que no pierda el orden que lleva en la
ejecución de los comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas
sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le
aparecerá el siguiente error:
> # Error in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...) :
> # plot.new has not been called yet
>
>
> plot(dist, type="cfpp",ylim=c(0,100), col="brown",lwd=3, ylab="Frecuencia
(%)",xlab="Variable continua",main="PERIODO 954 - POLÍGONO
FRECUENCIAS RELATIVAS ACUMULADAS (%)") #POLIGONO DE
FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE
> abline(h=25, col="black") # frecuencia = 25%
> abline(h=50, col="red") # frecuencia = 50%
> abline(h=75, col="black") # frecuencia = 75%
> abline(h=100, col="black") # frecuencia = 100%
> abline(v=mean(CONTINUA), col="red")# Media
> abline(v=quantile(CONTINUA, 0.25), col="blue")# Cuantil Q1
> abline(v=quantile(CONTINUA, 0.5),col="blue")# Cuantil Q2 (es la misma
mediana)
> abline(v=quantile(CONTINUA, 0.75),col="blue")# Cuantil Q3
> abline(v=max(CONTINUA), col="blue") # valor máximo
>
> # Donde se une la línea roja horizontal con el gráfico, indica que en ese valor
hay una probabilidad del 50% de encontrar valores menores o iguales al
indicado en el eje X.
>
> #Distribución emprica
> ECDF=ecdf(CONTINUA)
> ECDF
Empirical CDF
Call: ecdf(CONTINUA)
x[1:161] = 3.91, 3.92, 4.03, ..., 7.59, 7.66
> minimos<-min(CONTINUA)
> maximos<-max(CONTINUA)
>
> # Al igual que con la gráfica anterior, cuando ejecute el próximo comando y le
aparezca la gráfica "Distribución empírica", por favor NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde
aparece el nombre del código), para que no pierda el orden que lleva en la
ejecución de los comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas
sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le
aparecerá un error.
>
> # GRÁFICO DE DISTRIBUCIÓN EMPÍRICA
>
> plot(ECDF,col="red",lwd=1,xlab="VARIABLE CONTINUA",ylab="Distribución
empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="PERIODO 954 -
DISTRIBUCIÓN EMPÍRICA")
> abline(h=0.5, col="red") # la línea horizontal de color rojo, indica el 50%
de la frecuencia de la variable
> abline(v=median(CONTINUA), col="red", ) # la línea vertical de color rojo
indica la mediana de la variable
> abline(v=mean(CONTINUA), col="blue", ) # la línea vertical de color azul
indica la media de la variable
>
>
># CÁLCULO DE PROBABILIDADES
>
> media= mean(CONTINUA)
> sigma=sd(CONTINUA)
>
> # Dentro del rango de valores de la variable elegida, indique aquel del que
quiere conocer su probabilidad.
>
> X<- 90 # Reemplace el valor X por aquel del que desea hallar la probabilidad
>
> pnorm(X,media,sigma) # probabilidad de hallar un valor igual o menor a X
[1] 1
>
> 1-pnorm(X,media,sigma) # probabilidad de hallar un valor mayor a X
[1] 0
>
>
> # Preparado por:
>
> # Luis Alberto Cáceres
> # Director de Curso

También podría gustarte