Está en la página 1de 32

FASE 3.

DOCUMENTO DE APLICACIÓN DE CONCEPTOS DE PROBABILIDAD

PRESENTADO POR:
JULIÁN DAVID PAREJA SUÁREZ
CÓDIGO: 75.107.166
Jhon Anderson Luna
CÓDIGO: 1120376608
José Rodolfo Malagón Pulido
CÓDIGO:1120383673

PROGRAMA DE AGRONOMÍA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD – CEAD ACACIAS, META


ESCUELA DE CIENCIAS AGRÍCOLAS, PECUARIAS Y DEL MEDIO AMBIENTE -
ESTADÍSTICA DESCRIPTIVA (PARA AGRARIAS)
3 DE MAYO DE 2019
INTRODUCCIÓN

Por medio de una investigación bibliográfica, en el presente trabajo se da a conocer


el amplio enfoque que tiene la estadística descriptiva agraria a partir de los
conceptos básicos y los modelos estadísticos aplicados en el software estadístico
R; los cuales finalmente son indispensables ya que se entrelazan los conceptos con
el desarrollo aplicado de los códigos en el software.

OBJETIVOS

Objetivo general
 Conocer, profundizar y analizar la evolución, el desarrollo y el campo de
aplicación de la estadística descriptiva para agrarias junto con el desarrollo
del software R.

Objetivos específicos
 Conocer conceptos asociados a la estadística descriptiva para agrarias, con
el propósito de profundizar los conceptos importantes.
 Resaltar la importancia de la estadística descriptiva por su amplio campo de
aplicación junto con el software estadístico R.
 Evidenciar la importancia y la aplicación de la estadística descriptiva para el
ingeniero agrónomo en el desarrollo de ejercicios estadísticos.
VARIABLES ALEATORIAS Y PROBABILIDADES
1. Código dados ejecutados en R
El código ejecutado en R “Dados”, es un experimento aleatorio con dados ya que
con este se obtienen los posibles conjuntos al combinar cada número, obteniendo
36 posibles resultados como se evidencia en las imágenes ejecutadas a partir de
un vector creado para dar continuidad con los 36 datos tanto para impares como
pares.
DISTRIBUCIÓN NORMAL
Qué tipo de histograma se seleccionar un modelo probabilístico para una variable
aleatoria continua cuando se tienen datos de esa variable se utiliza un histograma
de frecuencias relativas.

Que es la estandarización, cuál es su formula


La estandarización es cuando la media de la distribución normal es cero y la
varianza es 1, se denomina normal tipificada y su ventaja radica en que existe una
serie de tablas que permiten conocer esos mismos valores de la Gaussiana,
donde se recoge la probabilidad acumulada para cada punto de la curva de la
distribución.
𝑌−𝜇
𝑍=
√𝜎 2
DISTRIBUCIÓN BINOMIAL
Qué tipo de conteos se trabajan con la distribución Binomial
Es una distribución de probabilidad discreta que cuenta el número de éxitos en una
secuencia de n ensayos de Bernoulli. Donde el conteo es n experimentos
independientes.
En la distribución binomial que es n y que es P.
P es la probabilidad de éxito, n es el número ensayos.
A que es igual la esperanza y la varianza en esta distribución.
Esperanza 𝜇 = 𝑛𝑃
Varianza 𝜎 2 = 𝑛𝑃(1 − 𝑃)

DISTRIBUCIÓN DE POISSON
Que tipos de conteos se trabaja con la distribución de Poisson.
El tipo de conteo se refiere al número de veces que un evento ocurre en una unidad
de tiempo o espacio dada (hora, kilo, m2, m3, planta, etc.) y por tanto los valores de
la variable no están acotados
En agronomía se usa para que tipo de conteos, les recuerdo los ácaros por ejemplo
se pueden trabajar con esta distribución.
En Agronomía, la distribución Poisson suele usarse para modelar el número de
insectos sobre una planta, o en un golpe de red, el número de manchas defectuosas
en un mosaico, o en un metro cuadrado de piso, el número de colémbolos en 100 g
de suelo, o en 1000 cm3 de suelo o el número de coliformes en 1 ml de agua, entre
otros conteos de interés.
Como se denota el único parámetro de esta distribución, a que es igual la
media y la varianza.
Único parámetro se denota con la letra 𝜆, la media y la varianza es igual al
parámetro 𝜆
𝜇 = 𝐸(𝑦) = 𝜆
𝜎 2 = 𝑉(𝑦) = 𝜆

Revisando el ejercicio de la tabla 3.1 del libro de Balzarini como se obtiene λ


en este caso a que es igual la media y la varianza.
Para obtener el único parámetro se halla la media aritmética de los 50 datos con lo
cual se obtiene 37, es decir,
𝜇 = 37 𝐾𝑔 𝑑𝑒 𝑎𝑟𝑟𝑜𝑧 = 𝜎 2
Ejercicio 2.1: Supongamos que se toma una muestra aleatoria con reposición de
tamaño n=2 a partir del conjunto {1,2,3} y se produce el siguiente espacio muestral
con 9 puntos muéstrales:
𝛺 = {(1,1), (1,2), (1,3), (2,1), (2,2), (2,3), (3,1), (3,2), (3,3)}
Supongamos además que definimos la variable aleatoria Y=suma de los dos
números, que conforma un nuevo espacio probabilístico y que estamos
interesados en los siguientes eventos:
El evento A conformado por los puntos muéstrales cuya suma sea un número par,
es decir,
𝐴 = {(1,1), (1,3), (2,2), (3,1), (3,3)} 𝑦 𝑃(𝐴) = 5/9.
El evento B conformado por los puntos muéstrales cuya suma sea un número
impar, siendo
𝐵 = {(1,2), (2,1), (2,3), (3,2)} 𝑦 𝑃(𝐵) = 4/9.
El evento C conformado por los elementos cuya suma es 5.

2
𝐶 = {(2,3), (3,2)} 𝑦 𝑃(𝐶) =
9
Preguntas:
a) ¿Qué tipo de concepto de probabilidad aplicaría para calcular
probabilidades?
El tipo de probabilidad a usar es
b) Los eventos A y B, ¿son independientes?
No son independientes

c) ¿Cuál es la probabilidad de que ocurra A o B?

5 4 9
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) = + = =1
9 9 9

d) ¿Cuál es la probabilidad de que ocurra B o C?

4 2 2 4
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) = + − =
9 9 9 9
e) Representar tabularmente a F(Y).

Suma de los números fi Fi hi Hi


2 1 1 0.111 0.111
3 2 3 0.222 0.333
4 3 6 0.333 0.666
5 2 8 0.222 0.889
6 1 9 0.111 1
Total 9 1

FRECUENCIAS RELATIVAS ACUMULADAS SUMA DE DE LOS NUMEROS


1.0
0.8
Frecuencias relativas

0.6
0.4
0.2
0.0

2 3 4 5 6

Ejercicio 2.3: Los siguientes datos corresponden a la venta de tractores que


registra una empresa de maquinarias agrícolas en los días laborables del
último año:
Tractores Cantidad de
vendidos días
0 110
1 80
2 35
3 25
4 10
Total 260

Tractores Cantidad
hi
vendidos de días
0 110 0,4230769
1 80 0,3076923
2 35 0,1346154
3 25 0,0961538
4 10 0,0384615
Total 260 1

Preguntas:
a) ¿Cuál es la variable en estudio?

La variable de estudio es la cantidad de tractores vendidos por día.

b) ¿Cuántos resultados posibles tiene la variable? ¿Qué tipo de variable es?

Tiene 5 resultados posibles, el tipo de variable es discreta.

c) ¿Cuál es la probabilidad de que hoy no venda ningún tractor?

110
𝑃(𝑥 = 0) = = 0,423, 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟 42,3%
260
d) ¿Cuál es la probabilidad que un día, seleccionado al azar dentro de los días
laborables del año, venda 3 o más tractores?

𝑃(𝑥 ≥ 3) = 0,0961538 + 0,0384615 = 0,1346153, 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟 13,46%

e) ¿Cuál es la probabilidad que en los próximos dos días venda 3 tractores?

25 24 3
𝑃= × = = 0,0088, 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟 0,89%
260 260 338
TRABAJO CON VARIABLES DE CIENCIAS AGRARIAS

Teniendo en cuenta que soy estudiante de agronomía y que el código del curso es
par, el desarrollo del código se realizó con ácaros 2.

 Variables continuas discretas (Ácaros 2):


 Variables cuantitativas continuas (Ácaros 2):
HISTOGRAMA DE FRECUENCIAS ABSOLUTAS

POLIGONO DE FRECUENCIAS ABSOLUTAS

HISTOGRAMA DE FRECUENCIAS RELATIVAS


POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS EN PROCENTAJE

DISTRIBUCIÓN EMPÍRICA
pH 3

Teniendo en cuenta los datos para Ph 3, se concluye por medio de la distribución


empírica que el 50% del potencial de hidrogeno son menores o iguales a la mediana,
ya que en este caso cinco (5) es el valor de la mediana.

 MODELO NORMAL

Variable continúa
Deben revisar en el texto el ejercicio de las vacas del tambo en el texto, en el código
de MODELOS, deben correr el código para este ejercicio que esta con los datos del
texto, adicionalmente deben hacer la gráfica de la función de densidad con una
media de 28 y 23 ambas con una varianza de 10 misma varianza en ambos casos,
y hacer el ejercicio con un media de 32 y dos varianzas una de 10 y otra de 8, es el
caso de la misma media y dos varianzas, que pasa cuando se cambia le media y
hay la misma varianza, hacia donde se desplaza la figura y que pasa cuando se
cambia la varianza en que se afecta la figura.
En el texto revisar el ejercicio de los híbridos de maíz y en el código MODELOS
correr el código para los datos registrados en este código que son los mismos del
libro, adicionalmente determinar la probabilidad de un valor entre 62 y 51 para el
rendimiento, también la probabilidad de un valor menor de 59 y un valor mayor a
53.

Tipos de curvas

Curvas de acuerdo al sesgo:


1. Una curva es simétrica o normal si la moda, la mediana y la media aritmética son
iguales.
2. Una curva es asimétrica positiva o de sesgo a la derecha si la moda es menor a la
mediana, y la mediana es menor a la media aritmética.
3. Una curva es asimétrica negativa o de sesgo a la izquierda si la media aritmética es
menor a la mediana y la mediana es menor a la moda.

Curva de acuerdo al apuntamiento

Si la curva es más plana que la normal se dice que la curva es platicúrtica; si es más
aguda que la normal, recibe el nombre de apuntada o leptocúrtica. Si la distribución
es normal, la curva se conoce también como mesocúrtica.

Función de Distribución N(MEDIA.MEDIA2 EN ROJO,MISMA VARIANZA)


0.12
0.10
0.08
F(x)

0.06
0.04
0.02
0.00

10 15 20 25 30 35 40

La curva representativa es la de una distribución normal.


Función de Distribución N(MEDIA.MEDIA2 EN ROJO,MISMA VARIANZA)

0.12
0.10
0.08
F(x)

0.06
0.04
0.02
0.00

10 15 20 25 30 35 40

La primera grafica muestra una distribución normal de las vacas de tambo con los
datos originales con una sola media que es de 25 y una varianza de 9, al cambiar
la media de 25 a 30 y deja r la misma varianza la gráfica se traslada 5 unidades a
la derecha.

Función de Distribución N(VARIANZA.VARIANZA1 EN ROJO,MISMA MEDIA)


0.4
0.3
F(x)

0.2
0.1
0.0

10 15 20 25 30 35 40

x
Función de Distribución N(VARIANZA.VARIANZA1 EN ROJO,MISMA MEDIA)

0.4
0.3
F(x)

0.2
0.1
0.0

10 15 20 25 30 35 40

Al dejar la media igual y cambiar la varianza la curva cambia o se vuelve apuntada


o queda aplanchada. En este caso la curva es leptocúrtica.

Cambio de medias y varianza con la original

Función de Distribución N(MEDIA.MEDIA2 EN ROJO,MISMA VARIANZA)


0.12
0.10
0.08
F(x)

0.06
0.04
0.02
0.00

10 20 30 40 50

x
Función de Distribución N(MEDIA.MEDIA2 EN ROJO,MISMA VARIANZA)

0.12
0.10
0.08
F(x)

0.06
0.04
0.02
0.00

10 20 30 40 50

Para este caso la función se traslada a la izquierda 8 unidades alcanzando siempre


la misma altura.

Función de Distribución N(VARIANZA.VARIANZA1 EN ROJO,MISMA MEDIA)


0.4
0.3
F(x)

0.2
0.1
0.0

10 15 20 25 30 35 40

x
La grafica al cambiar la varianza se convierte en leptocúrtica.

En el texto revisar el ejercicio de los híbridos de maíz y en el código MODELOS


correr el código para los datos registrados en este código que son los mismos del
libro, adicionalmente determinar la probabilidad de un valor entre 62 y 51 para el
rendimiento, también la probabilidad de un valor menor de 59 y un valor mayor a
53.
Función de Distribución N(media.sigma)
0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Función de Distribución N(media.sigma)


0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

x
El área bajo de la curva de la función normal nos indica la probabilidad que existe
encontrar un maíz hibrido entre determinados valores; en este caso se halla la
probabilidad de que se encuentre entre 50 y 65, para el valor mínimo al realizar la
diferencia con la media arroja un valor negativo para z y para el máximo un valor
positivo. Entonces para el rendimiento menor de 50 la probabilidad es de 0,0765 y
para un rendimiento mayor a 50 es de 0,9234. Para hallar la probabilidad entre 50
y 65 se realiza una resta entre las probabilidades encontradas lo cual arroja una
𝑝(50 < 𝑥 < 65) = 0,6859

Función de Distribución N(media.sigma)


0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Función de Distribución N(media.sigma)


0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Al cambiar los limites de probabilidad se puede evidenciar que el area bajo la curva
cambia. Para un rendimineto este entre 51 y 62 tiene una probabilidad del 0,5131.
Función de Distribución N(media.sigma)
0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Función de Distribución N(media.sigma)


0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

𝑝(53 < 𝑥 < 59) = 0,2845

MODELO BINOMIAL
En el texto deben revisar en tema de modelo binomial el ejercicio de la
germinación de semillas de panicum correrlo con los datos del código
MODELOS que son los mismos del libro, adicionalmente CON AYUDA DEL
CÓDIGO determinar la probabilidad de germinar 5 semillas, por lo menos
cuatro y a lo sumo 4.
Del análisis de R se puede concluir:
𝑝(𝑥 = 7) = 0.00308
𝑝(𝑥 < 3) = 0,5255
𝑝(𝑥 > 3) = 0,4745
𝑃(𝑥 ≥ 5) = 0,9802

La esperanza es de 2,5 y la varianza de 1,875

Del análisis de R se puede concluir:


𝑝(𝑥 = 5) = 0.005839
𝑝(𝑥 < 4) = 0.7758
𝑝(𝑥 > 4) = 0,2249
𝑃(𝑥 ≥ 4) = 0,9218
La varianza es 1,875 y su media o valor esperado 2,5

MODELO POISSON
El estudiante debe revisar del texto el ejercicio de las picaduras del
Gorgojo, correr el código MODELOS que está con los datos del texto, y
adicionalmente determinar cuántas de 100 semillas tendrán 3 picaduras
y cuantas 6 o más, en este caso saque las probabilidades de 0,1,2,3,4,5
las suma y se las resta a uno.
5
𝑒 −𝜆 𝜆𝑖
𝑝(𝑥 ≥ 6) = 1 − ∑
𝑖!
𝑖=0
𝑒 −0,2 (0,2)0
𝑝(𝑥 = 0) = = 0,818730753
0!

𝑒 −0,2 (0,2)1
𝑝(𝑥 = 1) = = 0,16374615
1!
−0,2 (0,2)2
𝑒
𝑝(𝑥 = 2) = = 0,016374615
2!

𝑒 −0,2 (0,2)3
𝑝(𝑥 = 3) = = 0,001091641
3!
𝑒 −0,2 (0,2)4
𝑝(𝑥 = 4) = = 0,000054582
4!
−0,2 (0,2)5
𝑒
𝑝(𝑥 = 5) = = 0,000002183
5!
5
𝑒 −𝜆 𝜆𝑖
∑ = 0,999999924
𝑖!
𝑖=0

𝑝(𝑥 ≥ 6) = 1 − 0,999999924 = 0,000000075


Función de Distribución N(media.sigma)
0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Función de Distribución N(media.sigma)


0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

x
El área bajo de la curva de la función normal nos indica la probabilidad que existe
encontrar un maíz hibrido entre determinados valores; en este caso se halla la
probabilidad de que se encuentre entre 50 y 65, para el valor mínimo al realizar la
diferencia con la media arroja un valor negativo para z y para el máximo un valor
positivo. Entonces para el rendimiento menor de 50 la probabilidad es de 0,0765 y
para un rendimiento mayor a 50 es de 0,9234. Para hallar la probabilidad entre 50
y 65 se realiza una resta entre las probabilidades encontradas lo cual arroja una
𝑝(50 < 𝑥 < 65) = 0,6859

Función de Distribución N(media.sigma)


0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

x
Función de Distribución N(media.sigma)

0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Al cambiar los limites de probabilidad se puede evidenciar que el area bajo la curva
cambia. Para un rendimineto este entre 51 y 62 tiene una probabilidad del 0,5131.
Función de Distribución N(media.sigma)

0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Función de Distribución N(media.sigma)


0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

𝑝(53 < 𝑥 < 59) = 0,2845

MODELO BINOMIAL
En el texto deben revisar en tema de modelo binomial el ejercicio de la
germinación de semillas de panicum correrlo con los datos del código
MODELOS que son los mismos del libro, adicionalmente CON AYUDA DEL
CÓDIGO determinar la probabilidad de germinar 5 semillas, por lo menos
cuatro y a lo sumo 4.
Del análisis de R se puede concluir:
𝑝(𝑥 = 7) = 0.00308
𝑝(𝑥 < 3) = 0,5255
𝑝(𝑥 > 3) = 0,4745
𝑃(𝑥 ≥ 5) = 0,9802

La esperanza es de 2,5 y la varianza de 1,875

Del análisis de R se puede concluir:


𝑝(𝑥 = 5) = 0.005839
𝑝(𝑥 < 4) = 0.7758
𝑝(𝑥 > 4) = 0,2249
𝑃(𝑥 ≥ 4) = 0,9218
La varianza es 1,875 y su media o valor esperado 2,5

MODELO POISSON
El estudiante debe revisar del texto el ejercicio de las picaduras del
Gorgojo, correr el código MODELOS que está con los datos del texto, y
adicionalmente determinar cuántas de 100 semillas tendrán 3 picaduras
y cuantas 6 o más, en este caso saque las probabilidades de 0,1,2,3,4,5
las suma y se las resta a uno.
5
𝑒 −𝜆 𝜆𝑖
𝑝(𝑥 ≥ 6) = 1 − ∑
𝑖!
𝑖=0
𝑒 −0,2 (0,2)0
𝑝(𝑥 = 0) = = 0,818730753
0!

𝑒 −0,2 (0,2)1
𝑝(𝑥 = 1) = = 0,16374615
1!
𝑒 −0,2 (0,2)2
𝑝(𝑥 = 2) = = 0,016374615
2!

𝑒 −0,2 (0,2)3
𝑝(𝑥 = 3) = = 0,001091641
3!
−0,2 (0,2)4
𝑒
𝑝(𝑥 = 4) = = 0,000054582
4!
𝑒 −0,2 (0,2)5
𝑝(𝑥 = 5) = = 0,000002183
5!
5
𝑒 −𝜆 𝜆𝑖
∑ = 0,999999924
𝑖!
𝑖=0

𝑝(𝑥 ≥ 6) = 1 − 0,999999924 = 0,000000075

Conclusión

Con base al desarrollo de la actividad propuesta, se afianzaron los conceptos a las


preguntas orientadoras por medio de una investigación bibliográfica, donde se logró
entender la importancia de la estadística descriptiva en cualquier campo de
aplicación junto al software estadístico R, por la gran ventaja que tiene al correr
modelos o códigos estadísticos.

También podría gustarte