Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejercicio Final - Estadistica
Ejercicio Final - Estadistica
VALOR ABSOLUTAS
7 3
8 6
9 14
10 20
11 10
12 30
13 19
14 23
15 14
16 21
17 16
18 15
19 10
20 7
21 3
22 6
23 3
Total 220
ABSOLUTAS
VALOR ACUMULADAS
7 3
8 9
9 23
10 43
11 53
12 83
13 102
14 125
15 139
16 160
17 176
18 191
19 201
20 208
21 211
22 217
23 220
VALOR RELATIVA
7 0,01363636
8 0,02727273
9 0,06363636
10 0,09090909
11 0,04545455
12 0,13636364
13 0,08636364
14 0,10454545
15 0,06363636
16 0,09545455
17 0,07272727
18 0,06818182
19 0,04545455
20 0,03181818
21 0,01363636
22 0,02727273
23 0,01363636
Total 1
relativas
valor acumuladas
7 0,01363636
8 0,04090909
9 0,10454545
10 0,19545454
11 0,24090909
12 0,37727273
13 0,46363637
14 0,56818182
15 0,63181818
16 0,72727273
17 0,80000000
18 0,86818182
19 0,91363637
20 0,94545455
21 0,95909091
22 0,98636364
23 1,00000000
20
15
10
5
0
7 8 9 11 13 15 17 19 21 23
0.08
0.06
0.04
0.02
0.00
7 8 9 11 13 15 17 19 21 23
• Gráfico de Frecuencias Relativas Acumuladas
0.6
0.4
0.2
0.0
7 8 9 11 13 15 17 19 21 23
VALOR
Nombre de la variable elegida Variables agrícolas
Valor Mínimo 3.910
Valor máximo 7.660
Media 5.882
Mediana 5.935
Varianza 0.7709453
Desviación estándar 0.8780349
Tabla resumen indicando:
Frecuencia Frecuencia
Intervalo de Frecuencia Frecuencia absoluta acumulada Frecuencia
datos absoluta relativa acumulada en % relativa %
3.871 - 4.3 7 0.03 7 3.18 3.18
4.3 - 4.73 14 0.06 21 9.55 6.36
4.73 - 5.159 29 0.13 50 22.73 13.18
5.159 - 5.589 36 0.16 86 39.09 16.36
5.589 - 6.019 30 0.14 116 52.73 13.64
6.019 - 6.448 43 0.20 159 72.27 19.55
6.448 - 6.878 28 0.13 187 85.00 12.73
6.878 - 7.307 21 0.10 208 94.55 9.55
7.307 - 7.737 12 0.05 220 100 5.45
3.2.2. Presente los siguientes gráficos, haciendo una descripción de cada uno
de ellos y analice los resultados obtenidos:
• "HISTOGRAMA DE FRECUENCIAS ABSOLUTAS"
En este intervalo puedo observar que el intervalo mayor es de 6.02 - 6.45, el cual es el
sexto intervalo, con una frecuencia de 43, que el primer intervalo es el primero con una
frecuencia de 7 y no observo datos atípicos.
• "POLIGONO DE FRECUENCIAS ABSOLUTAS"
Puedo observar que son los mismos datos del histograma anterior, encontramos los
mismos intervalos y la misma frecuencia.
Puedo observar que la variable continúa inicia en cero y aumenta de una manera
consecutiva hasta llegar a 1.0.
3.3. Con los resultados obtenidos al ejecutar el script, el director de curso proporcionará
en el foro de discusión tres cuestionarios (uno con enfoque agrícola, otro con enfoque
pecuario y otro con enfoque ambiental). Cada grupo deberá elegir uno de los tres, de
acuerdo con el programa de estudio que predomine en el grupo y resolverlo.
Variable discreta: número de frutos (Agri_discreta)
En un cultivo de tomate de árbol, se realizó un muestreo determinando el número de
frutos por árbol que, de acuerdo con su grado de maduración, estarían listos a ser
cosechados dentro de un mes. Si la plantación tiene 2000 árboles:
1.1. ¿Cuál es la probabilidad de obtener una cosecha de al menos 24.000 frutos?
1.2. ¿Cuál es la probabilidad de obtener una cosecha menor o igual a 28.000 frutos?
1.3. ¿Cuál es la probabilidad de obtener una cosecha exacta de 30.000 frutos?
1.4. ¿Qué modelo de distribución se debe usar en este caso para el cálculo de
probabilidades?
Explique su respuesta.
2. Variable continua: pH (Agri_continua)
Se desea sembrar banano en 100 hectáreas, para ello, previamente se realizó una
muestra de suelo por hectárea y se determinó el pH.
2.1. De acuerdo con el pH óptimo para la siembra de banano, ¿considera que el suelo
analizado
es adecuado para su cultivo?
2.2. ¿Cuál es la probabilidad de hallar un valor de pH mayor de 5?0?
2.3. Si el pH óptimo para la siembra de banano se encontrara entre 5.5 y 7.5, ¿cuál es la
probabilidad de que las muestras analizadas se encuentren dentro de este rango?
No olvide incluir en la bibliografía los documentos consultados en los que se apoyó
para hacer sus recomendaciones.
CONCLUSIÓN
BIBLIOGRAFIA
Copia de los resultados obtenidos al ejecutar el script en la consola de resultados
del programa R
>
> # Instalación del paquete "fdth"
> # Cuando aparezca el listado, elegir: "0-cloud [https]" y después: "fdth". hacer
clic en "OK"
> # Esperar hasta que instale el paquete de comandos, puede tardar varios
minutos
> # Esperar hasta que el cursor se vea de nuevo de color rojo en la parte de
abajo de la Consola R
>
> utils:::menuInstallPkgs() # seleccionar: "0-cloud [https]" y después: "fdth"
--- Please select a CRAN mirror for use in this session ---
probando la URL 'https://cloud.r-project.org/bin/windows/contrib/4.1/fdth_1.2-
6.zip'
Content type 'application/zip' length 295062 bytes (288 KB)
downloaded 288 KB
sd, var
Warning message:
package ‘fdth’ was built under R version 4.1.2
>
> # El grupo debe escoger entre los tres tipos de variables continuas
existentes:
> # Para los estudiantes de zootecnia, la variable "Zoo_continua", que es el
peso de conejos.
> # Para los estudiantes de agronomía, la variable "Agri_continua", que es el
potencial de hidrógeno del suelo.
> # Para los estudiantes de ambiental, la variable "Amb_continua", que
corresponde al material particulado de 2.5
> # Si en el grupo hay estudiantes de distintos programas, deben ponerse de
acuerdo para escoger una sola variable con la que van a trabajar
>
> CONTINUA=Agri_continua # En esta linea reemplace la palabra
"Agri_continua" por la variable seleccionada por el grupo
>
> # Si el grupo seleccionó "Agri_continua" entonces la línea previa deberá
quedar así: VARIABLECONTINUA=Agri_continua
>
> summary(CONTINUA)
Min. 1st Qu. Median Mean 3rd Qu. Max.
3.910 5.200 5.935 5.882 6.522 7.660
> VARIANZA=var(CONTINUA)
> VARIANZA
[1] 0.7709453
> SIGMA=sd(CONTINUA)
> SIGMA
[1] 0.8780349
>
>
># TABLA DE FRECUENCIAS
>
> dist <- fdt(CONTINUA)
> dist# Esta tabla presenta el intervalo inferior y superior, la frecuencia absoluta
(f), frecuencia relativa (rf), frecuencia relativa en porcenaje (rf(%)), frecuencia
acumulada (cf) y frecuencia acumulada en porcentaje (cf(%))
Class limits f rf rf(%) cf cf(%)
[3.871,4.3) 7 0.03 3.18 7 3.18
[4.3,4.73) 14 0.06 6.36 21 9.55
[4.73,5.159) 29 0.13 13.18 50 22.73
[5.159,5.589) 36 0.16 16.36 86 39.09
[5.589,6.019) 30 0.14 13.64 116 52.73
[6.019,6.448) 43 0.20 19.55 159 72.27
[6.448,6.878) 28 0.13 12.73 187 85.00
[6.878,7.307) 21 0.10 9.55 208 94.55
[7.307,7.737) 12 0.05 5.45 220 100.00
>
># GRÁFICOS DE VARIABLES CONTINUAS
>
> plot(dist, type="fh",col="blue",xlab="Intervalo de la variable
continua",main="PERIODO 954 - HISTOGRAMA FRECUENCIAS
ABSOLUTAS") # HISTOGRAMA DE FRECUENCIAS ABSOLUTAS
> plot(dist, type="fp",col="blue", lwd=2, main="PERIODO 954 - POLIGONO
FRECUENCIAS ABSOLUTAS VARIABLE CONTINUA") #POLIGONO DE
FRECUENCIAS ABSOLUTAS
> plot(dist, type="rfh",col="blue",xlab="Intervalo variable
conitnua",main="PERIODO 954 - HISTOGRAMA FRECUENCIAS
RELATIVAS")#HISTOGRAMA DE FRECUENCIAS RELATIVAS
>
> # Cuando ejecute el siguiente comando y le aparezca la gráfica de
"POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS EN
PORCENTAJE", por favor NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde
aparece el nombre del código), para que no pierda el orden que lleva en la
ejecución de los comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas
sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le
aparecerá el siguiente error:
> # Error in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...) :
> # plot.new has not been called yet
>
>
> plot(dist, type="cfpp",ylim=c(0,100), col="brown",lwd=3, ylab="Frecuencia
(%)",xlab="Variable continua",main="PERIODO 954 - POLÍGONO
FRECUENCIAS RELATIVAS ACUMULADAS (%)") #POLIGONO DE
FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE
> abline(h=25, col="black") # frecuencia = 25%
> abline(h=50, col="red") # frecuencia = 50%
> abline(h=75, col="black") # frecuencia = 75%
> abline(h=100, col="black") # frecuencia = 100%
> abline(v=mean(CONTINUA), col="red")# Media
> abline(v=quantile(CONTINUA, 0.25), col="blue")# Cuantil Q1
> abline(v=quantile(CONTINUA, 0.5),col="blue")# Cuantil Q2 (es la misma
mediana)
> abline(v=quantile(CONTINUA, 0.75),col="blue")# Cuantil Q3
> abline(v=max(CONTINUA), col="blue") # valor máximo
>
> # Donde se une la línea roja horizontal con el gráfico, indica que en ese valor
hay una probabilidad del 50% de encontrar valores menores o iguales al
indicado en el eje X.
>
> #Distribución emprica
> ECDF=ecdf(CONTINUA)
> ECDF
Empirical CDF
Call: ecdf(CONTINUA)
x[1:161] = 3.91, 3.92, 4.03, ..., 7.59, 7.66
> minimos<-min(CONTINUA)
> maximos<-max(CONTINUA)
>
> # Al igual que con la gráfica anterior, cuando ejecute el próximo comando y le
aparezca la gráfica "Distribución empírica", por favor NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde
aparece el nombre del código), para que no pierda el orden que lleva en la
ejecución de los comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas
sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le
aparecerá un error.
>
> # GRÁFICO DE DISTRIBUCIÓN EMPÍRICA
>
> plot(ECDF,col="red",lwd=1,xlab="VARIABLE CONTINUA",ylab="Distribución
empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="PERIODO 954 -
DISTRIBUCIÓN EMPÍRICA")
> abline(h=0.5, col="red") # la línea horizontal de color rojo, indica el 50%
de la frecuencia de la variable
> abline(v=median(CONTINUA), col="red", ) # la línea vertical de color rojo
indica la mediana de la variable
> abline(v=mean(CONTINUA), col="blue", ) # la línea vertical de color azul
indica la media de la variable
>
>
># CÁLCULO DE PROBABILIDADES
>
> media= mean(CONTINUA)
> sigma=sd(CONTINUA)
>
> # Dentro del rango de valores de la variable elegida, indique aquel del que
quiere conocer su probabilidad.
>
> X<- 90 # Reemplace el valor X por aquel del que desea hallar la probabilidad
>
> pnorm(X,media,sigma) # probabilidad de hallar un valor igual o menor a X
[1] 1
>
> 1-pnorm(X,media,sigma) # probabilidad de hallar un valor mayor a X
[1] 0
>
>
> # Preparado por:
>
> # Luis Alberto Cáceres
> # Director de Curso