Está en la página 1de 35

ESTADÍSTICA DESCRIPTIVA (300046_109)

FASE 3 DISTRIBUCION Y PROBABILIDAD

PRESENTADO POR:
LAURA NATALY MARTÍNEZ PALACIOS
LEIDY JOHANA HERNÁNDEZ HERNÁNDEZ
ANDREA CAROLINA RIVERA MEDINA
YULIANA FERNANDA SIERRA PEÑA

TUTORA:
JESSICA ALMEIDA BRAGA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)


ESCUELA DE CIENCIAS AGRÍCOLAS, PECUARIAS Y DEL MEDIO AMBIENTE
(ECAPMA)
CEAD CHIQUINQUIRÁ
2021
INTRODUCCION
En esta fase estaremos hablando sobre la distribución y probabilidad entonces tenemos
que son como una lista que proporciona todos los valores que se puedan presentar en un
acontecimiento. Existen varios tipos de distribución de probabilidad como lo son
distribución de probabilidad binomial, de Poisson y normal que se pueden representar en
gráficas para mayor comprensión de los datos.
OBJETIVOS
Adquirir conocimiento sobre conceptos básicos de probabilidad y distribuciones de
probabilidad, en ciencias agrarias.
Realizar cada uno de los ejercicios planteados en la guía de actividades
Ejecutar el programa R de manera eficaz, relacionándolo con la información suministrada.
DESARROLLO
1. Revisar el OVI y los Contenidos y referentes bibliográficos de la Unidad 2,
ubicados en el Entorno de Aprendizaje y explicar en sus propias palabras los
siguientes términos:
Aporte 1, Laura Nataly Martínez Palacios, 300046_109.
a. Espacio muestral, con qué letra se denota:
El espacio muestral se denota con la letra griega Ω, la cual se denomina (Omega).
b. Punto muestral:
Los puntos muestrales se representan con esta letra (ω), estos puntos hacen parte del
espacio muestral Ω, es decir, cada elemento de Ω se le llama punto muestral.
c. Evento muestral:
Un evento muestral se refiere a uno o varios resultados posibles de un experimento
aleatorio, lo cual quiere decir, no se sabe con certeza que es lo que va a salir. Por otra
parte, hace parte de un subconjunto del espacio muestral.
d. Variable aleatoria:
La variable aleatoria se refiere a una función, la cual se le va asignar un valor
numérico, dependiendo del experimento aleatorio.
e. ¿Qué significa que el espacio muestral de una variable aleatoria continua es no
contable?
Significa que los datos no son precisos o exactos, no se puede dar un numero de
posibilidades, ya que pueden existir infinidades de posibilidades, por eso se dice que
una variable aleatoria continua no es contable.
Aporte Andrea Carolina Rivera

g. Existen dos conceptos de probabilidad: el clásico y el concepto frecuencial; defina


cada uno.
R: la probabilidad es: que tan posible es que ocurra cierto evento determinado, cuando
no se tiene certeza de ciertos resultados, se habla de probabilidad, es decir; que tan
común es que esto ocurra.
Para calcular la probabilidad clásica se utilizan los puntos muestrales favorables y el
número total de puntos muestrales en el espacio muestral.
La probabilidad frecuencial no se tiene el conocimiento del espacio muestral, entonces
lo que se hace es calcular probabilidades,” independiente”

h. En el caso de la probabilidad frecuencial, explique el experimento de


germinación de una semilla, cuál es el experimento aleatorio, cuál es el evento y
cuantos puntos muéstrales tiene.
R: con las semillas se hacen varios experimentos uno es independiente del otro.
Por ejemplo: sembramos 1000 semillas de frijol de las cuales solo nacen 400 es una
frecuencia o una probabilidad, entonces tendríamos
nA/N=400/1000=0.4 de probabilidad de germinación de las semillas de frijol.

i. ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de


probabilidad?
La frecuencia relativa es el cociente entre la frecuencia absoluta de determinado
valor y un número total de datos, se representa ni. Mientras que la probabilidad se
trata de que tan posible es que ocurra un evento y no tiene certeza de ciertos
resultados
j. ¿Qué son eventos mutuamente excluyentes? ¿Cómo es la intersección de dos
eventos mutuamente excluyentes? ¿Si son excluyentes, dado un evento A y uno B, a
que es igual la P(A ꓴ B)?
¿Qué son eventos mutuamente excluyentes?
Surgen como resultado de operaciones efectuadas en la Teoría de conjuntos,
donde grupos de elementos constituidos en conjuntos y sub-conjuntos, se agrupan o
demarcan según factores relacionales; Unión ( U ), intersección ( ∩ ) y complemento
( ‘ ) entre otros.
Pueden ser tratados desde distintas ramas (matemática, estadística, probabilidad
y lógica entre otros…) pero su composición conceptual será siempre la misma.
¿Cómo es la intersección de dos eventos mutuamente excluyentes?
Propiedades de los eventos mutuamente excluyentes:
Sean A y B dos eventos mutuamente excluyentes entre si
A∩B=B∩A=∅
Si A = B’ son eventos complementarios
A U B = S (Espacio muestral)
P (A ∩ B) = 0; La probabilidad de ocurrencia simultanea de estos eventos es nula
Recursos como el diagrama de Venn facilitan notablemente la clasificación de
eventos mutuamente excluyentes entre otros, ya que permite visualizar por completo
la magnitud de cada conjunto o subconjunto.

Los conjuntos que no posean eventos comunes o simplemente estén separados,


serán considerados como incompatibles y mutuamente excluyentes.

¿Si son excluyentes, dado un evento A y uno B, a que es igual la P(A ꓴ B)?

Si son mutuamente excluyentes, entonces se tendría P(A ꓴ B) =P(A)+P(B).Es decir, para


sacar una carta roja o un trébol, se suman las probabilidades de sacra la carta roja y la
probabilidad de sacar el trébol.
k. En el caso de distribuciones de variables aleatorias, si una variable es continua
y simétrica, ¿qué modelo se usa?
R: Modelos de probabilidad (introducción)
Modelos Discretos
Distribución dicotómica (Bernoulli): esta toma el valor de 1 si la probabilidad
es de éxito(ocurre) se representa con p o de 0 si es fracaso (no ocurre) entonces
quedaría q=1-p
Distribución hipergeométrica: digamos que se tiene una población N
elementos de los cuales K pertenece a la categoría A y N-K estos pertenecen a la
categoría B. entonces esta se encarga de medir x(0≤x≤K elementos de la categoría A
en una muestra sin reemplazo de n que son los elemento de la población original.
Distribución de poisson: se presenta cuando hay ocurrencia media, lo que
quiere decir; que es la probabilidad de que ocurra determinado número de sucesos,
eventos en cierto periodo de tiempo. Se especializa en probabilidades muy pequeñas.
Convergencia binomial-poisson: tiende a converger a la distribución cuando n
tiende a infinito y el p tiende a ser 0. Entonces se tendría que el producto de n *p sea
una cantidad constante. Cuando ocurre esto la distribución binominal tiende a un
modelo de poisson de parámetro l n*p
Modelos Continuos
Distribución uniforme: para cada miembro de la familia, todos los intervalos de
igual longitud en la distribución en su rango tienen igualdad de probabilidad. El
dominio está definido por dos parámetros a y b que son valores que representan el
máximo o el mínimo respectivamente. Abreviadamente se escribe U (a, b)
Distribución exponencial: se utiliza para modelar tiempos de espera para la
ocurrencia de cierto evento. También se le llama distribución gamma.
Distribución normal: esta puede ser representada en un histograma, lleva una forma
acampanada en donde las desviaciones estándar sucesivas con respecto a la media
establecen valores para estimar el porcentaje en la observación de datos. En este
caso los datos de mayor porcentaje están en el centro, y los que están en los
extremos son los dat5os que tienen menor frecuencia.

l. Para una variable de conteo no acotado, ¿qué modelo se utiliza?


Para este tipo de variables se utiliza el modelo de poisson, el cual tiene como
característica principal mediante la cual se expresa la frecuencia media y la
probabilidad con la que ocurre un número de hechos o eventos dentro de un grupo
de datos obtenidos, teniendo en cuenta que este modelo es utilizado en variables
de tipo discreta.
m. para variables de proporciones ¿qué modelo se utiliza?
Para variables de proporciones se utiliza el modelo de regresión en el cual se
evidencia la relación de una variable con otra variable, se debe tener en cuenta
que este es un modelo matemático en el cual se busca tener en cuenta distintos
caracteres mediante los cuales se logra determinar las características de las
variables.
n. ¿Qué variables tienen función de probabilidad y cuáles variables tienen función
de densidad?
En la variable aleatoria dentro de la cual se enfoca en el tipo de variable discreta,
debido a que tiene en cuenta la asignación de probabilidad a los datos
presentados y las variables que tiene función de densidad son las variables
aleatorias de tipo continuo donde la variable tiene un valor determinado.
o. ¿Cuáles son los parámetros más usados en estadística para estudiar y utilizar
funciones de distribución de variables aleatorias?

Los parámetros más usados son la esperanza matemática para una variable
aleatoria discreta y continua, en la cual se tienen en cuenta los datos presentados
y la varianza de estos dos tipos de variables.
la fórmula para hallar la esperanza matemática aleatoria discreta:

La fórmula para hallar la esperanza matemática aleatoria continua:

p. ¿Qué es la esperanza matemática de una variable aleatoria? ¿cómo se


denota?

La esperanza matemática es el cálculo en el cual se encuentra explicito la media


aritmética, mediante la cual se tiene en cuenta que es un valor medio esperado; se
denota mediante la suma del producto de la probabilidad de cada suceso por el
valor de dicho suceso. La fórmula que se utiliza para a hallarla es:

2. Lea el Capítulo 3 – Modelos probabilísticos del libro Estadística y Biometría de


Mónica Balzarini y responda las siguientes preguntas:
a. Qué tipo de histograma se debe seleccionar en un modelo probabilístico
para una variable aleatoria continua cuando se tienen datos de esa variable.
Para seleccionar un modelo probalístico de una variable aleatoria continua
cuando se tienen datos de esa variable, se grafica un histograma de frecuencias
relativas. Los nombres de los modelos de probabilidad son: Chi- cuadrado, normal,
exponencial y uniforme.
Respondiendo a la pregunta, se usa el histograma de modelo normal de la
frecuencia relativa.

b. Qué es la estandarización, cuál es su fórmula.


Es una transformación que nos permite llevar cualquier distribución normal
a la distribución normal estándar.
Su fórmula es: 2=(y-µ)/√(σ^2 )

c. Qué tipo de conteos se trabajan con la distribución Binomial.


Se realizan cierto número de experimentos aleatorios y en cada
experimento se registra uno de dos resultados posibles, éxito o fracaso, donde el
éxito tiene cierta probabilidad. Este ensayo con resultado binario se conoce como
“ensayo Bernoulli”.

d. En la distribución binomial qué es n y qué es P.


N es el número de ensayos Bernoulli independientes y P es la probabilidad
del éxito.

e. A qué es igual la esperanza y la varianza en la distribución binomial.


La esperanza en la distribución binominal es igual a 20 * 0,5 = 10 y la
varianza es igual a 20 * 0,5 * 0,5 = 5.
f. Mencione ejemplos en su área de estudio donde se podría utilizar la distribución
Binomial.
En el uso de las cantidades de fertilizantes, el tipo de pruebas que se usan en el
estudio de los suelos, si definimos si un fruto pertenece a los vegetales o a las
frutas, el tipo de semilla que se usa en un cultivo y el trazado a utilizar en este
mismo.
g. Qué tipos de conteos se trabajan con la distribución de Poisson.
Los conteos a trabajar son de forma aleatoria y de manera que se terminen
teniendo intervalos infinitos teniendo en cuenta que se determinan mediante el
número de hechos que suceden en un determinado tiempo.
h. Cómo se denota el único parámetro de la distribución de Poisson.
“la distribución Poisson facilita el cálculo de probabilidades de variables aleatorias
que provienen de conteos no acotados” (Balzarini), pues en sus conteos se refiere
al número de veces que un evento ocurre en una unidad dada de algún tiempo o
espacio.

i.¿A qué es igual la media y la varianza en la distribución de Poisson?


La varianza de una Poisson es función de la media, es decir, que es igual cuando
al aumentar el promedio de conteos, aumenta también su varianza.
μ=E(Y)=λ
σ^2=V(Y)=λ

j. Mencione ejemplos en su área de estudio donde se podría utilizar la distribución


de Poisson.
Se puede utilizar para averiguar el número de califormes en 1 ml de agua.
Se puede utilizar para modelar el número de manchas defectuosas en un
mosaico.
Se puede utilizar para modelar el número de insectos sobre una planta.
Se puede utilizar para desarrollar el número de colémbolos en 100 gramos
de suelo o en 1000 centímetros cúbicos.

10. Abra “Script Fase 3 - DADOS.txt”, ejecútelo y responda las siguientes


preguntas:
a. Explique en sus propias palabras el experimento aleatorio del dado. Este
ejercicio nos ayudará a entender los conceptos de probabilidad y
distribución.

Segundo aporte, Laura Nataly Martínez Palacios, 300046_109.


Resultados del programa R:
# EXPERIMENTO ALEATORIO LANZAR DOS DADOS - PERIODO 951
>
> # Hay 36 posibles resultados, que da de combinar cada número con los demás
> # Iniciamos con el número 1 en el primer dado y lo vamos combinando con las seis
posibles opciones del segundo dado (1,2,3,4,5,6)
> # Hacemos lo mismo con el número 2 del primer dado y las seis combinaciones que
puede haber con el segundo y así sucesivamente,
> # hasta obtener una matriz de ESPACIO MUESTRAL como se presenta a continuación:
> # (1,1), (1,2), (1,3), (1,4), (1,5), (1,6),
> # (2,1), (2,2), (2,3), (2,4), (2,5), (2,6),
> # (3,1), (3,2), (3,3), (3,4), (3,5), (3,6),
> # (4,1), (4,2), (4,3), (4,4), (4,5), (4,6),
> # (5,1), (5,2), (5,3), (5,4), (5,5), (5,6),
> # (6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}
>
> # VEMOS QUE HAY 36 RESULTADOS POSIBLES, POR TANTO, ESTE ES EL
ESPACIO MUESTRAL
> # La probabilidad siempre tendrá denominador 36 (x/36)
> # PUNTOS MUESTRALES = 36
> # Los eventos son subconjuntos del espacio muestral (los 36 posibles resultados del
dado)
> # Por ejemplo, un evento puede ser que en ambos dados salgan números pares (2,2 4,4
6,6)
> # Otro evento puede ser sacar dos números iguales, en donde se tendrían los
siguientes posibles resultados:
> # POSIBLE RESULTADOS: (1,1), (2,2), (3,3), (4,4), (5,5), (6,6)
> # En este caso habría 6 resultados de éxito de los 36 posibles del espacio muestral.
> # La probabilidad por tanto de obtener dos números iguales sería: 6/36 = 0.166 O 16,6%
en términos porcentuales
 Con este experimento aleatorio al lanzar dos dados, se puede evidenciar que el
espacio muestral seria 36 posibles resultados, ya que cada dado tiene 6 caras y al
multiplicar 6 por 6 se obtiene como resultado 36; este experimento es variable
aleatoria discreta, ya que el número de posibilidades es contable. En el
experimento se evidencia las 36 posibilidades al lanzar los dos dados; por otra
parte, se observa ejemplos por evento, los cuales pueden ser números pares, de
este evento se obtendría 6 posibles resultados.

b. Adjunte en el informe los tres gráficos generados por el script (Frecuencias Absolutas,
frecuencias relativas y frecuencias relativas acumuladas). No debe haber más de un
gráfico por página.
aporte 2 Andrea Rivera
PERIODO 951 - Gráfico de barras SUMA DE CARAS
6
5
Frecuencias absolutas

4
3
2
1
0

2 3 4 5 6 7 8 9 10 11 12

En este grafico se evidencia la distribución normal donde la suma de las caras del dado
en el centro está representado el mayor porcentaje; es decir los de mayor frecuencia,
mientras que a los extremos están los datos de menor frecuencia.
Lo anterior quiere decir que para obtener 2 números iguales la probabilidad seria 6 de 36
lo que quiere decir que sería un 16% mientras que a los extremos se refleja que las
probabilidades van disminuyendo.
PERIODO 951 - FRECUENCIAS RELATIVAS SUMA DE CARAS
0.20
0.15
Frecuencias relativas

0.10
0.05
0.00

2 3 4 5 6 7 8 9 10 11 12

En esta grafica nos está mostrando la probabilidad en el dos y el doce hay una
probabilidad de 2.7, mientras que en el 3 y el 11 hay probabilidad de 0.05 en el
4 y el 10 es de 0.08, en el 5 y el 9 es del 0.11, en el 6 y el 0.3 mientras que en
el 7 se tiene una alta probabilidad que es de 0.16 esto es un diagrama normal
donde el alto porcentaje está en la mitad mientras que los extremos van
reflejando los datos con menos probabilidades.
PERIODO 951 - FRECUENCIAS RELATIVAS ACUMULADAS SUMA DE CARAS
1.0
0.8
Frecuencias relativas

0.6
0.4
0.2
0.0

2 3 4 5 6 7 8 9 10 11 12

En este grafico vemos las frecuencias absolutas acumuladas donde se observa que en el
caso de dos hay una probabilidad de 0.02 en el de 3 es de 0.08, de 4 es de 0.16, de 5 es
de 0.27, de 6 es de 0.41, de 6 es de 0.41, de 7 es de 0.58, de 8 es de 0.72, de 9 es de
0.83, de 10 es de 0.91, de 11 es de 0.97 y de 12 es de 1.000con referente a lo anterior
vemos que al hacer las respectivas operaciones la frecuencia relativa acumulada presenta
una alta probabilidad en 12 y en las otras disminuye relativamente.

一 11. Abra en el programa R “Script Fase 3 – MODELOS.txt” y ejecútelo de acuerdo


a las indicaciones dadas previamente. Este script dará respuesta a los ejercicios del libro
“Estadística y Biometría de Mónica Balzarini” en el Capítulo 3 – Modelos probabilísticos;
describa los ejercicios y responda las siguientes preguntas: a. Distribución normal -
Ejercicio de las vacas del tambo (página 91).

Presente y describa el gráfico "Producción de leche - Función de Distribución N (misma


varianza, distinta media)". Este gráfico muestra dos distribuciones dentro de la misma
gráfica -una azul y otra roja-. Para obtenerlo, cuando aparezca la gráfica de distribución
de color azul, NO LA CIERRE, continúe ejecutando el script (para volver al script, ubique
el cursor en el marco azul, donde aparece el nombre del script, para que no pierda la
secuencia de ejecución).

Producción de leche - Función de Distribución N (misma varianza, distinta


media).
PERIODO 951 - Producción de leche Función de Distribución N (misma varianza, distinta media
0.12
0.10
0.08
F(x)

0.06
0.04
0.02
0.00

10 15 20 25 30 35 40

Producción de leche (litros/día)

PERIODO 951 - Producción de leche Función de Distribución N (misma varianza, distinta media
0.12
0.10
0.08
F(x)

0.06
0.04
0.02
0.00

10 15 20 25 30 35 40

Producción de leche (litros/día)

En estas graficas se evidencian como en la misma varianza y con distinta medida se


denota que la gráfica tiene como punto clave 25 litros de leche y así como asciende en los
puntos de 10 a 25 desciende en la producción de 25 a 40 litros de leche; como se muestra
en las dos anteriores gráficas. Teniendo en cuenta que en el grafico se evidencian dos
distribuciones entre las cuales se encuentran que el punto más alto dentro del grafico en
la línea azul es de 25 litros y en la línea roja es de 30 litros por tanto se incrementa el
número de litros en una de las distribuciones respecto a la otra.
Presente y describa el gráfico "Producción de leche - Función de Distribución N (misma
media, distinta varianza". Al igual que el anterior, muestra dos distribuciones en la misma
gráfica, cada una con distinta varianza, cuando le aparezca el primer gráfico (color azul)
no lo cierre y continúe ejecutando el script hasta que le aparezca la segunda línea de
distribución (color rojo).
"Producción de leche - Función de Distribución N (misma media, distinta varianza
PERIODO 951 - Producción de leche Función de Distribución N (misma media, distinta varianza

0.4
0.3
F(x)

0.2
0.1
0.0

10 15 20 25 30 35 40

Producción de leche (litros/día)

PERIODO 951 - Producción de leche Función de Distribución N (misma media, distinta varianza
0.4
0.3
F(x)

0.2
0.1
0.0

10 15 20 25 30 35 40

Producción de leche (litros/día)

En este grafico se evidencia que las distribuciones teniendo en cuenta que la varianza
cambia por tanto se evidencia que en la primera distribución crece en 25 litros hasta 0.1,
mientras que en la distribución de 25 litros con una aproximación de 0.3; es así
como se evidencia el crecimiento de las distribuciones en cuanto a la varianza y sus
diferencias.

b. Probabilidad en distribución normal - Ejercicio del híbrido de maíz (página 93).


Segundo aporte, Leidy Johana Hernández Hernández, 300046_109.
Resultados del programa R:
> # EJERCICIO DE HIBRIDO MAIZ, Libro Estadística y Biometría de Mónica Balzarini,
CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución normal, página 93
>
> # Si Y es el rendimiento de un híbrido de maíz que puede modelarse con una
distribución normal, con media de 60 qq/Ha y varianza de 49 qq/Ha:
> media= 60
> varianza= 49
> sigma=sqrt(varianza)
> sigma
[1] 7
> X=seq(35,85,by=0.5) # Secuencia de valores en un un rango de 35 a 85 qq/Ha
> dnorm(X,media,sigma)
[1] 9.684491e-05 1.246690e-04 1.596703e-04 2.034576e-04 2.579337e-04
[6] 3.253318e-04 4.082527e-04 5.097014e-04 6.331212e-04 7.824238e-04
[11] 9.620142e-04 1.176807e-03 1.432231e-03 1.734223e-03 2.089206e-03
[16] 2.504043e-03 2.985977e-03 3.542545e-03 4.181465e-03 4.910501e-03
[21] 5.737297e-03 6.669190e-03 7.712995e-03 8.874773e-03 1.015958e-02
[26] 1.157120e-02 1.311188e-02 1.478210e-02 1.658026e-02 1.850251e-02
[31] 2.054255e-02 2.269145e-02 2.493758e-02 2.726658e-02 2.966137e-02
[36] 3.210228e-02 3.456725e-02 3.703206e-02 3.947074e-02 4.185592e-02
[41] 4.415934e-02 4.635244e-02 4.840685e-02 5.029505e-02 5.199096e-02
[46] 5.347055e-02 5.471239e-02 5.569818e-02 5.641316e-02 5.684655e-02
[51] 5.699175e-02 5.684655e-02 5.641316e-02 5.569818e-02 5.471239e-02
[56] 5.347055e-02 5.199096e-02 5.029505e-02 4.840685e-02 4.635244e-02
[61] 4.415934e-02 4.185592e-02 3.947074e-02 3.703206e-02 3.456725e-02
[66] 3.210228e-02 2.966137e-02 2.726658e-02 2.493758e-02 2.269145e-02
[71] 2.054255e-02 1.850251e-02 1.658026e-02 1.478210e-02 1.311188e-02
[76] 1.157120e-02 1.015958e-02 8.874773e-03 7.712995e-03 6.669190e-03
[81] 5.737297e-03 4.910501e-03 4.181465e-03 3.542545e-03 2.985977e-03
[86] 2.504043e-03 2.089206e-03 1.734223e-03 1.432231e-03 1.176807e-03
[91] 9.620142e-04 7.824238e-04 6.331212e-04 5.097014e-04 4.082527e-04
[96] 3.253318e-04 2.579337e-04 2.034576e-04 1.596703e-04 1.246690e-04
[101] 9.684491e-05
>
> # Gráfico de distribución normal con media = 60 y varianza = 49
>
> curve(dnorm(x,media,sigma),xlim=c(20,100),col="blue",lwd=2,
+ xlab="Rendimiento (qq/Ha)",ylab="F(x)",main="PERIODO 951 - Rendimiento de
maíz - Función de Distribución N(media.sigma)")
>
> # Especificamos el valor del que queremos saber su probabilidad, en este caso, 50:
> valor=50
> pnorm(valor,media,sigma)
[1] 0.07656373
>
> # Quiere decir que la probabilidad de que el rendimiento esté por debajo de 50 qq/Ha es
de 0.0765 o del 7.65 por ciento
>
> #PROBABILIDAD DE UN VALOR MAYOR
> valor=50
> # Para hallar la probabilidad de un valor mayor que 50, se resta 1 menos la probabilidad
de hallar un valor igual o menor:
>
> 1-pnorm(valor,media,sigma)
[1] 0.9234363
> # En este caso, la probabilidad de que el rendimiento esté por encima de 50 qq/Ha, es
de 0.923 o 92.3 por ciento.
>
> # PROBABILIDAD EN UN RANGO DE VALORES
>
> # Probabilidad que un dato de rendimiento tomado al azar esté comprendido en el
intervalo de 50 a 65 qq/Ha:
> # Reemplaze por el rango de valores, valor 2 es el mayor y valor 1 es el menor:
> valor1=50
> valor2=65
> VALOR1=pnorm(valor1,media,sigma)
> VALOR1
[1] 0.07656373
> VALOR2=pnorm(valor2,media,sigma)
> VALOR2
[1] 0.7624747
>
> # PROBABILIDAD que el rendimiento se encuentre en el intervalo de 50 a 65 qq/Ha:
> VALOR2-VALOR1
[1] 0.685911
>
> # Se resta la probabilidad de que el rendimiento esté por debajo de 65 qq/Ha (p=0.762),
menos la probabilidad de que esté por debajo de 50 qq/Ha (0.0765)
>
> regionX=seq(valor1,valor2,0.01) # Intervalo a sombrear
>
> # GRAFICA DE ÁREA BAJO LA CURVA ENTRE 50 Y 65 qq/Ha
>
> xP <- c(valor1,regionX,valor2) # Base de los polígonos que crean el efecto
"sombra"
> yP <- c(0,dnorm(regionX,media,sigma),0) # Altura de los polígonos sombreados
>
> # Cuando le abra la gráfica no la cierre y vuelva al Editor R, seleccionando el marco azul
del cuadro, donde aparece el nombre del código
> curve(dnorm(x,media,sigma),xlim=c(20,100),col="blue",lwd=2,
+ PERIODO
xlab="Rendimiento (qq/Ha)",ylab="F(x)",main="PERIODO 951 - Rendimiento de
951 - Rendimiento de maíz - Función de Distribución N(media.sigma)
maíz Distribución Normal con área bajo la curva")
> polygon(xP,yP,col="orange1") # Área bajo la curva entre 50 y 65 qq/Ha
0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Rendimiento (qq/Ha)
 Este es un diagrama del rendimiento de maíz en función de distribución
(media. sigma), lo que nos indica este gráfico es que cuando la función de
distribución es de 0.00 se mantiene el rendimiento hasta casi 40 qq /Ha, ya
luego, la función de distribución se eleva por encima 0.05 y el rendimiento
es de 60 qq/Ha, cuando disminuye la función de distribución a 0.00 el
rendimiento del maíz se mantiene hasta llegar a 100 qq/Ha.

PERIODO 951 - Rendimiento de maíz Distribución Normal con área bajo la curva
0.05
0.04
0.03
F (x)

0.02
0.01
0.00

20  Este
40 es un diagrama60 de rendimiento
80 de maíz100
normal con área bajo la
curva, esteRendimiento
grafico (qq/Ha)
nos indica lo mismo que el anterior, a veces se
mantiene el rendimiento, se eleva o también disminuye.

c. Distribución binomial - Ejercicio de la semilla de Panicum sp. (página 102).

Tercer aporte, Laura Nataly Martínez Palacios, 300046_109.


> # MODELOS DE DISTRIBUCIONES - PERIODO 951
> # DISTRIBUCION BINOMIAL
> # Ejercicio de la semilla de Panicum, Libro Estadística y Biometría de Mónica Balzarini,
CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución binomial, página 101:
> # Debe presentar estos resultados en su informe:
>
> # Supóngase que se toman 10 semillas de Panicum sp y se registra el evento
"Germinó"o "No germinó",después de 5 días desde su implantación:
> k= 7 # Queremos saber la probabilidad que germinen 7 de las 10 semillas
> n= 10 # Número total de ensayos realizados, en este caso son 10, que fueron el
número de semillas evaluadas
> p= 0.25 # La probabilidad de germinación de las semillas fue del 25 por ciento
>
> dbinom(k,n,p) # PROBABILIDAD DE UN VALOR IGUAL P(X=7), "que germinen siete
semillas"
[1] 0.003089905
>
> # Probabilidad que germinen al menos 3 de las 10 semillas:
> # En este caso, se interpreta como la probabilidad de que germinen tres o más semillas
> # Es equivalente a la probabilidad que germinen 3 semillas, más la probabilidad que
germinen 4, más la prob. que germinen 5; y así sucesivamente hasta 10.
> # Otra forma de calcularlo es a la inversa, calculando la probabilidad que germinen
menos de 3 y restándole a la probabilidad total:
>
> k1=2 # Hay que calcular la probabilidad de un valor que sea una unidad menor
que el que queremos hallar
>
> pbinom(k1, n, p) # esta es la probabilidad de que germinen menos de 3 semillas
[1] 0.5255928
>
> #Para conocer la probabilidad que germinen 3 o más semillas se resta 1 menos el
anterior resultado:
> 1-pbinom (k1, n, p) # La probabilidad de que germinen 3 o más semillas es de 0.4744 o
del 47.44 por ciento
[1] 0.4744072
>
> # Probabilidad de que germinen a lo sumo 5 semillas:
> # A lo sumo se interpreta que germinen máximo 5 semillas
> k2=5
> pbinom (k2, n, p) # La probabilidad de que germinen a lo sumo 5 semillas, es de 0.98 o
del 98 por ciento
[1] 0.9802723
>
> # La esperanza de esta variable aleatoria:
> E=n*p
>E
[1] 2.5
> # La esperanza es de 2.5
>
> # La varianza de esta variable aleatoria
> V=n*p*(1-p)
>V
[1] 1.875
> # La varianza es de 1.875
>
> # Gráfico de distribución Binomial para el ejercicio de germinación de semillas:
>
> x <- 0: n
> prob <- dbinom(x,n,p)
> barplot(prob,col = "red",names.arg=x,
+ xlab="Evento (germinación de x semillas)",ylab="Probabilidad del
evento",main="PERIODO 951 - Distribución Binomial - Germinación de semillas\
n(n=10,p=0.25)")
> #este gráfico muestra la probabilidad de ocurrencia de cada uno de los 11 eventos
posibles, es decir que germinen 0 semillas, 1., hasta 10.
> # En este caso, cuando p es menor que 0.5, la distribución se encuentra sesgada
positivamente hacia la izquierda
 En el siguiente grafico se evidencia las probabilidades de que germine las semillas
y por la otra parte se observa la germinación por semillas de 1 a 10; dando esto
como resultado, probabilidad de germinación de 7 a 10 las semillas de un 0, 25, lo
cual es un 25%. este ejercicio es de variable aleatoria discreta, ya que es contable
el número de posibilidades.
d. Distribución Poisson - Ejercicio de las picaduras de gorgojo (página 105).

i. Indique la probabilidad de que en 100 semillas una tenga 1 picadura


R: según el modelo de distribución de poisson la probabilidad de que 100 semillas solo
una tenga picadura es de 0.164
ii. Indique la probabilidad de que en 100 semillas dos o más tengan picaduras.
Debido a lo anterior que hay una probabilidad de 0.164, entonces se presenta que
solo 16 semillas cumplirían la condición, por lo tanto, se aproximaría que 2 de cada
100 semillas tendrían 2 o más picaduras
iii. Indique la probabilidad de que en 100 semillas ninguna tenga picaduras
La probabilidad de que ninguna semilla tenga picaduras es de 0.819, entonces
se esperaría que de 100 semillas 82 aproximadamente no estén picadas
# DISTRIBUCION DE POISSON
>
> # La distribución de Poisson se usa para distribuciones de variables discretas (conteos)
> # EJERCICIO DE LAS PICADURAS DE GORGOJO, Libro Estadística y Biometría de
Mónica Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución Poisson,
página 105:
> # Supongamos que el número promedio de picaduras de gorgojo por semilla es 0.2 (es
decir, que cada 100 semillas 20 tienen picaduras).
> # PROBABILIDAD DE UN VALOR EXACTO
> x1= 1 # Valor de conteo que se quiere calcular la probabilidad
> lamda=0.2 # En la distribución de Poisson lamda equivale a la media o a la varianza,
son el mismo valor
> dpois(x1,lamda) # La probabilidad de que en 100 semillas una tenga 1 picadura es de
0.1637 o de 16.37 por ciento
[1] 0.1637462
>
> ## DOS PICADURAS O MAS TOCA A UNO QUITARLE LAS PROBABILIDADES DE
CERO MAS LA DE UNO
> x0=0 # El valor de conteo que se quiere calcular la probabilidad, en este caso que
ninguna semilla tenga picaduras
> x2=1
> lamda=0.2 #media o varianza como es igual
> dpois(x0,lamda) # La probabilidad de que ninguna semilla tenga picaduras es de
0.8187 o del 81.87 por ciento
[1] 0.8187308
> 1-(dpois(x0,lamda)+dpois(x2,lamda)) # 1 menos la SUMA de la probabilidad de
tener cero picaduras mas una picdura (x0+x2)
[1] 0.0175231
> # La probabilidad de que 2 de las 100 semillas tengan picaduras es de 0.0175 o del 1.8
por ciento
>
> #Preparado por: Luis Alberto Cáceres - director de curso
>
>
BIBLIOGRAFIA

Araujo, César Iván. (8 de junio de 2019). Eventos mutuamente excluyentes: propiedades y


ejemplos. Lifeder. Recuperado de https://www.lifeder.com/eventos-mutuamente-
excluyentes/.
Luis Caceres (2021) Video explicativo distribución y probabilidad de variables
aleatoriashttps://unadvirtualedu-my.sharepoint.com/:v:/g/personal/
luis_caceres_unad_edu_co/
EW0pJiasBPZFmRTj47F4hLMBaTOYmSDVeh9cm6fUDl-9Yg?e=0ek3SS
Tomado de modelos de probabilidad https://www.uv.es/ceaces/base/modelos%20de
%20probabilidad/MODEPR1.htm#:~:text=Los%20modelos%20discretos%2C
%20son%20modelos,la%20%22distribuci%C3%B3n%20de%20Poisson%22.
Libro Estadística y Biometría de Mónica Balzarini:
https://www.researchgate.net/publication/
293811237_Estadistica_y_biometria_ilustraciones_del_uso_de_InfoSta

 Sáenz, J. (2010). Métodos estadísticos con R y R


comander. R
Project https://cran.r-project.org/doc/contrib/Saez-
Castillo-RRCmdrv21.pdf
CONSOLA R DADOS
R version 4.0.2 (2020-06-22) -- "Taking Off Again"
Copyright (C) 2020 The R Foundation for Statistical Computing
Platform: i386-w64-mingw32/i386 (32-bit)

R es un software libre y viene sin GARANTIA ALGUNA.


Usted puede redistribuirlo bajo ciertas circunstancias.
Escriba 'license()' o 'licence()' para detalles de distribucion.

R es un proyecto colaborativo con muchos contribuyentes.


Escriba 'contributors()' para obtener más información y
'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de


ayuda,
o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.
Escriba 'q()' para salir de R.

> # EXPERIMENTO ALEATORIO LANZAR DOS DADOS - PERIODO 951


>
> # Hay 36 posibles resultados, que da de combinar cada número con los
demás
> # Iniciamos con el número 1 en el primer dado y lo vamos combinando
con las seis posibles opciones del segundo dado (1,2,3,4,5,6)
> # Hacemos lo mismo con el número 2 del primer dado y las seis
combinaciones que puede haber con el segundo y así sucesivamente,
> # hasta obtener una matriz de ESPACIO MUESTRAL como se presenta
a continuación:
> #(1,1), (1,2), (1,3), (1,4), (1,5), (1,6),
> #(2,1), (2,2), (2,3), (2,4), (2,5), (2,6),
> #(3,1), (3,2), (3,3), (3,4), (3,5), (3,6),
> #(4,1), (4,2), (4,3), (4,4), (4,5), (4,6),
> #(5,1), (5,2), (5,3), (5,4), (5,5), (5,6),
> #(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}
>
> # VEMOS QUE HAY 36 RESULTADOS POSIBLES, POR TANTO ESTE
ES EL ESPACIO MUESTRAL
> # La probabilidad siempre tendrá denominador 36 (x/36)
> # PUNTOS MUESTRALES = 36
> # Los eventos son subconjuntos del espacio muestral (los 36 posibles
resultados del dado)
> # Por ejemplo, un evento puede ser que en ambos dados salgan
números pares (2,2 4,4 6,6)
> # Otro evento puede ser sacar dos números iguales, en donde se
tendrían los siguientes posibles resultados:
> # POSIBLE RESULTADOS: (1,1),(2,2),(3,3),(4,4),(5,5),(6,6)
> # En este caso habrían 6 resultados de éxito de los 36 posibles del
espacio muestral.
> # La probabilidad por tanto de obtener dos números iguales sería: 6/36 =
0.166 O 16,6% en términos porcentuales
>
> # VARIABLE ALEATORIA Y = SUMA DE VALORES
> # Es otra forma de presentar los 36 posibles eventos del espacio
muestral, en donde se suman los valores obtenidos en cada dado:
>
> #(2), (3), (4), (5), (6), (7),
> #(3), (4), (5), (6), (7), (8),
> #(4), (5), (6), (7), (8), (9),
> #(5), (6), (7), (8), (9), (10),
> #(6), (7), (8), (9), (10), (11),
> #(7), (8), (9), (10), (11), (12)
>
> # De esta forma se puede procesar su análisis en el programa R
>
> #PROCESAMIENTO EN R
>
> # Creamos el vector con los datos sumando los valores de cada dado,
como se indicó anteriormente
> # EJEMPLO:
> # (1,1),(1,2),(1,3),(1,4),(1,5),(1,6)
> # Sumando quedará: 2, 3, 4, 5, 6, 7 y así sucesivamente hasta llegar al
último evento (6,6):
>
> SUMADADOS=c(2, 3, 4, 5, 6, 7,
+ 3, 4, 5, 6, 7, 8,
+ 4, 5, 6, 7, 8, 9,
+ 5, 6, 7, 8, 9, 10,
+ 6, 7, 8, 9, 10, 11,
+ 7, 8, 9, 10, 11, 12)
>
> # TABLAS DE FRECUENCIAS PARA LA VARIABLE DISCRETA
"SUMADADOS":
>
> # En este caso las tabla de frecuencias se desarrollan por pasos:
>
> table(SUMADADOS) # Tabla de frecuencias absolutas
SUMADADOS
2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
> fabs=table(SUMADADOS) # Asignación al comando de Tabla
de frecuencias absolutas el nombre: "fabs"
> fabs
SUMADADOS
2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
> fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas
acumuladas
> fabsacum
2 3 4 5 6 7 8 9 10 11 12
1 3 6 10 15 21 26 30 33 35 36
> frel=prop.table(table(SUMADADOS)) # Asignación al comando de
Tabla de frecuencias relativas el nombre: "frel"
> frel # Tabla de frecuencias relativas
SUMADADOS
2 3 4 5 6 7 8
0.02777778 0.05555556 0.08333333 0.11111111 0.13888889 0.16666667
0.13888889
9 10 11 12
0.11111111 0.08333333 0.05555556 0.02777778
> # Podemos decir entonces que la probabilidad que la suma de las dos
caras sea igual a 2 es del 0.027 o 2.7% en términos porcentuales.
> # Las probabilidades se multiplican por 100 para expresarlas en
porcentaje.
>
> frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
> frelacum
2 3 4 5 6 7 8
0.02777778 0.08333333 0.16666667 0.27777778 0.41666667 0.58333333
0.72222222
9 10 11 12
0.83333333 0.91666667 0.97222222 1.00000000
> # En este caso, la probabilidad de obtener un valor mayor o igual a 2
pero menor de 4 es de 0.083 o 8.3%
> # es lo mismo que sumar la probabilidad de obtener un valor de 2 (0.027)
y de 3 (0.055) = 0.083
>
> # GRAFICOS DE FRECUENCIAS:
>
> barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 951 - Gráfico
de barras SUMA DE CARAS") # Gráfico de Frecuencias absolutas
> barplot(frel,ylab="Frecuencias
relativas",ylim=c(0,0.2),xlim=c(0,12),main="PERIODO 951 -
FRECUENCIAS RELATIVAS SUMA DE CARAS") # Gráfico de
Frecuencias relativas
> barplot(frelacum,ylab="Frecuencias relativas",main="PERIODO 951 -
FRECUENCIAS RELATIVAS ACUMULADAS SUMA DE CARAS") #
Gráfico de Frecuencias relativas acumuladas
>
> #Preparado por: Luis Alberto Cáceres - Director de curso
CONSOLA R MODELOS
R version 4.0.2 (2020-06-22) -- "Taking Off Again"
Copyright (C) 2020 The R Foundation for Statistical Computing
Platform: i386-w64-mingw32/i386 (32-bit)

R es un software libre y viene sin GARANTIA ALGUNA.


Usted puede redistribuirlo bajo ciertas circunstancias.
Escriba 'license()' o 'licence()' para detalles de distribucion.
R es un proyecto colaborativo con muchos contribuyentes.
Escriba 'contributors()' para obtener más información y
'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de


ayuda,
o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.
Escriba 'q()' para salir de R.

[Previously saved workspace restored]

> # MODELOS DE DISTRIBUCIONES - PERIODO 951


>
> # DISTRIBUCION NORMAL
> # EJERCIO DE LAS VACAS DEL TAMBO, Libro Estadística y Biometría
de Mónica Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS -
Distribución normal, página 91
> # La producción de leche diaria de las vacas de un tambo se distribuye
como el modelo normal, con esperanza 25 litros (que es la misma media) y
varianza de 9 litros al cuadrado:
> MEDIA=25
> VARIANZA=9
> # A las vacas se les da una nueva ración que aumenta su producción en
5 litros, pero no cambia la varianza, ya que son los mismos animales:
> MEDIA2=30
> SIGMA=sqrt(VARIANZA)
> x=seq(15,40,by=0.5) #secuencia de valores en un un rango de
producción de leche de 15 a 40 litros
> dnorm(x,MEDIA,SIGMA)
[1] 5.140930e-04 8.836587e-04 1.477283e-03 2.402033e-03 3.798662e-
03
[6] 5.842767e-03 8.740630e-03 1.271754e-02 1.799699e-02 2.477039e-
02
[11] 3.315905e-02 4.317253e-02 5.467002e-02 6.733290e-02 8.065691e-
02
[16] 9.397063e-02 1.064827e-01 1.173551e-01 1.257944e-01 1.311466e-
01
[21] 1.329808e-01 1.311466e-01 1.257944e-01 1.173551e-01 1.064827e-
01
[26] 9.397063e-02 8.065691e-02 6.733290e-02 5.467002e-02 4.317253e-
02
[31] 3.315905e-02 2.477039e-02 1.799699e-02 1.271754e-02 8.740630e-
03
[36] 5.842767e-03 3.798662e-03 2.402033e-03 1.477283e-03 8.836587e-
04
[41] 5.140930e-04 2.908942e-04 1.600902e-04 8.569012e-05 4.461008e-
05
[46] 2.258767e-05 1.112362e-05 5.327914e-06 2.482015e-06 1.124574e-
06
[51] 4.955732e-07
>
> # Gráfico de distribución normal con media = 25 y varianza = 9
> # POR FAVOR NO LO CIERRE, ya que sobre este mismo aparecerá el
siguiente gráfico (continúe ejecutando el código)
> # Cuando aparezca el gráfico, seleccione nuevamente el código de
ejecución (Editor R) ubicando el cursor en el MARCO AZUL, donde
aparece el nombre del código
> # De esta forma, mantendrá el orden de ejecución dentro del código:
>
> curve(dnorm(x,MEDIA,SIGMA),xlim=c(10,40),col="blue",lwd=2,
+ xlab="Producción de leche (litros/día)",ylab="F(x)",main="PERIODO
951 - Producción de leche Función de Distribución N (misma varianza,
distinta media")
>
> # Gráfico de distribución normal con media = 30 y varianza = 9
> # Este gráfico (de color rojo) le debe aparecer junto con el anterior gráfico
de color azul, en la misma gráfica:
>
> curve(dnorm(x,MEDIA2,SIGMA),xlim=c(10,40), add=TRUE, col="red",
lwd=2)
Warning message:
In curve(dnorm(x, MEDIA2, SIGMA), xlim = c(10, 40), add = TRUE, :
'add' will be ignored as there is no existing plot
>
> # se puede observar que cambia la ubicación de la media (esperanza),
pero la forma de ambas gráficas es la misma porque no cambió la varianza
>
> # Ahora se realiza el mismo procedimiento pero en este caso no cambia
la media (esperanza) sino las varianzas:
>
> MEDIA=25
> VARIANZA=9
> VARIANZA1=2
> SIGMA=sqrt(VARIANZA)
> SIGMA1=sqrt(VARIANZA1)
> x=seq(15,40,by=0.5)
> dnorm(x,MEDIA,SIGMA)
[1] 5.140930e-04 8.836587e-04 1.477283e-03 2.402033e-03 3.798662e-
03
[6] 5.842767e-03 8.740630e-03 1.271754e-02 1.799699e-02 2.477039e-
02
[11] 3.315905e-02 4.317253e-02 5.467002e-02 6.733290e-02 8.065691e-
02
[16] 9.397063e-02 1.064827e-01 1.173551e-01 1.257944e-01 1.311466e-
01
[21] 1.329808e-01 1.311466e-01 1.257944e-01 1.173551e-01 1.064827e-
01
[26] 9.397063e-02 8.065691e-02 6.733290e-02 5.467002e-02 4.317253e-
02
[31] 3.315905e-02 2.477039e-02 1.799699e-02 1.271754e-02 8.740630e-
03
[36] 5.842767e-03 3.798662e-03 2.402033e-03 1.477283e-03 8.836587e-
04
[41] 5.140930e-04 2.908942e-04 1.600902e-04 8.569012e-05 4.461008e-
05
[46] 2.258767e-05 1.112362e-05 5.327914e-06 2.482015e-06 1.124574e-
06
[51] 4.955732e-07
>
> # Gráfico de distribución normal con media = 25 y varianza = 9
> # POR FAVOR NO LO CIERRE, ya que sobre este mismo aparecerá el
siguiente gráfico (continúe ejecutando el código)
>
>
curve(dnorm(x,MEDIA,SIGMA),xlim=c(10,40),ylim=c(0,0.4),col="blue",lwd=
2,
+ xlab="Producción de leche (litros/día)",ylab="F(x)",main="PERIODO
951 - Producción de leche Función de Distribución N (misma media, distinta
varianza")
>
> # Gráfico de distribución normal con media = 25 y varianza = 2
> # Este gráfico (de color rojo) le debe aparecer junto con el anterior gráfico
de color azul, en la misma gráfica:
>
> curve(dnorm(x,MEDIA,SIGMA1),xlim=c(10,40), add=TRUE, col="red",
lwd=2)
Warning message:
In curve(dnorm(x, MEDIA, SIGMA1), xlim = c(10, 40), add = TRUE, :
'add' will be ignored as there is no existing plot
>
> # En este caso ambas gráficas tienen la misma media (o esperanza) pero
sus formas cambiaron porque tienen distinta varianza
> # A mayor varianza, la gráfica tendrá mayor amplitud
>
> # EJERCICIO DE HIBRIDO MAIZ, Libro Estadística y Biometría de
Mónica Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS -
Distribución normal, página 93
>
> # Si Y es el rendimiento de un híbrido de maíz que puede modelarse con
una distribución normal, con media de 60 qq/Ha y varianza de 49 qq/Ha:
> media= 60
> varianza= 49
> sigma=sqrt(varianza)
> sigma
[1] 7
> X=seq(35,85,by=0.5) # Secuencia de valores en un un rango de 35 a
85 qq/Ha
> dnorm(X,media,sigma)
[1] 9.684491e-05 1.246690e-04 1.596703e-04 2.034576e-04 2.579337e-
04
[6] 3.253318e-04 4.082527e-04 5.097014e-04 6.331212e-04 7.824238e-
04
[11] 9.620142e-04 1.176807e-03 1.432231e-03 1.734223e-03 2.089206e-
03
[16] 2.504043e-03 2.985977e-03 3.542545e-03 4.181465e-03 4.910501e-
03
[21] 5.737297e-03 6.669190e-03 7.712995e-03 8.874773e-03 1.015958e-
02
[26] 1.157120e-02 1.311188e-02 1.478210e-02 1.658026e-02 1.850251e-
02
[31] 2.054255e-02 2.269145e-02 2.493758e-02 2.726658e-02 2.966137e-
02
[36] 3.210228e-02 3.456725e-02 3.703206e-02 3.947074e-02 4.185592e-
02
[41] 4.415934e-02 4.635244e-02 4.840685e-02 5.029505e-02 5.199096e-
02
[46] 5.347055e-02 5.471239e-02 5.569818e-02 5.641316e-02 5.684655e-
02
[51] 5.699175e-02 5.684655e-02 5.641316e-02 5.569818e-02 5.471239e-
02
[56] 5.347055e-02 5.199096e-02 5.029505e-02 4.840685e-02 4.635244e-
02
[61] 4.415934e-02 4.185592e-02 3.947074e-02 3.703206e-02 3.456725e-
02
[66] 3.210228e-02 2.966137e-02 2.726658e-02 2.493758e-02 2.269145e-
02
[71] 2.054255e-02 1.850251e-02 1.658026e-02 1.478210e-02 1.311188e-
02
[76] 1.157120e-02 1.015958e-02 8.874773e-03 7.712995e-03 6.669190e-
03
[81] 5.737297e-03 4.910501e-03 4.181465e-03 3.542545e-03 2.985977e-
03
[86] 2.504043e-03 2.089206e-03 1.734223e-03 1.432231e-03 1.176807e-
03
[91] 9.620142e-04 7.824238e-04 6.331212e-04 5.097014e-04 4.082527e-
04
[96] 3.253318e-04 2.579337e-04 2.034576e-04 1.596703e-04 1.246690e-
04
[101] 9.684491e-05
>
> # Gráfico de distribución normal con media = 60 y varianza = 49
>
> curve(dnorm(x,media,sigma),xlim=c(20,100),col="blue",lwd=2,
+ xlab="Rendimiento (qq/Ha)",ylab="F(x)",main="PERIODO 951 -
Rendimiento de maíz - Función de Distribución N(media.sigma)")
>
> # Especificamos el valor del que queremos saber su probabilidad, en este
caso, 50:
> valor=50
> pnorm(valor,media,sigma)
[1] 0.07656373
>
> # Quiere decir que la probabilidad de que el rendimiento esté por debajo
de 50 qq/Ha es de 0.0765 o del 7.65 por ciento
>
> #PROBABILIDAD DE UN VALOR MAYOR
> valor=50
> # Para hallar la probabilidad de un valor mayor que 50, se resta 1 menos
la probabilidad de hallar un valor igual o menor:
>
> 1-pnorm(valor,media,sigma)
[1] 0.9234363
> # En este caso, la probabilidad de que el rendimiento esté por encima de
50 qq/Ha, es de 0.923 o 92.3 por ciento.
>
> # PROBABILIDAD EN UN RANGO DE VALORES
>
> # Probabilidad que un dato de rendimiento tomado al azar esté
comprendido en el intervalo de 50 a 65 qq/Ha:
> # Reemplaze por el rango de valores, valor 2 es el mayor y valor 1 es el
menor:
> valor1=50
> valor2=65
> VALOR1=pnorm(valor1,media,sigma)
> VALOR1
[1] 0.07656373
> VALOR2=pnorm(valor2,media,sigma)
> VALOR2
[1] 0.7624747
>
> # PROBABILIDAD que el rendimiento se encuentre en el intervalo de 50
a 65 qq/Ha:
> VALOR2-VALOR1
[1] 0.685911
>
> # Se resta la probabilidad de que el rendimiento esté por debajo de 65
qq/Ha (p=0.762), menos la probabilidad de que esté por debajo de 50
qq/Ha (0.0765)
>
> regionX=seq(valor1,valor2,0.01) # Intervalo a sombrear
>
> # GRAFICA DE ÁREA BAJO LA CURVA ENTRE 50 Y 65 qq/Ha
>
> xP <- c(valor1,regionX,valor2) # Base de los polígonos que crean
el efecto "sombra"
> yP <- c(0,dnorm(regionX,media,sigma),0) # Altura de los polígonos
sombreados
>
> # Cuando le abra la gráfica no la cierre y vuelva al Editor R,
seleccionando el marco azul del cuadro, donde aparece el nombre del
código
> curve(dnorm(x,media,sigma),xlim=c(20,100),col="blue",lwd=2,
+ xlab="Rendimiento (qq/Ha)",ylab="F(x)",main="PERIODO 951 -
Rendimiento de maíz Distribución Normal con área bajo la curva")
> polygon(xP,yP,col="orange1") # Área bajo la curva entre 50 y 65 qq/Ha
Error in polygon(xP, yP, col = "orange1") :
plot.new has not been called yet
> box() # Crea un marco rodeando el área bajo la curva
Error in box() : plot.new has not been called yet
>
> # DISTRIBUCION BINOMIAL
> # Ejercicio de la semilla de Panicum, Libro Estadística y Biometría de
Mónica Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS -
Distribución binomial, página 101:
> # Debe presentar estos resultados en su informe:
>
> # Supóngase que se toman 10 semillas de Panicum sp y se registra el
evento "Germinó"o "No germinó",después de 5 días desde su
implantación:
> k= 7 # Queremos saber la probabilidad que germinen 7 de las 10
semillas
> n= 10 # Número total de ensayos realizados, en este caso son 10, que
fueron el número de semillas evaluadas
> p= 0.25 # La probabilidad de germinación de las semillas fue del 25 por
ciento
>
> dbinom(k,n,p) # PROBABILIDAD DE UN VALOR IGUAL P(X=7), "que
germinen siete semillas"
[1] 0.003089905
>
> # Probabilidad que germinen al menos 3 de las 10 semillas:
> # En este caso, se interpreta como la probabilidad de que germinen tres
o más semillas
> # Es equivalente a la probabilidad que germinen 3 semillas, más la
probabilidad que germinen 4, más la prob. que germinen 5; y así
sucesivamente hasta 10.
> # Otra forma de calcularlo es a la inversa, calculando la probabilidad que
germinen menos de 3 y restándole a la probabilidad total:
>
> k1=2 # Hay que calcular la probabilidad de un valor que sea una
unidad menor que el que queremos hallar
>
> pbinom(k1,n,p) # esta es la probabilidad de que germinen menos de 3
semillas
[1] 0.5255928
>
> #Para conocer la probabilidad que germinen 3 o más semillas se resta 1
menos el anterior resultado:
> 1-pbinom(k1,n,p) # La probabilidad de que germinen 3 o más semillas
es de 0.4744 o del 47.44 por ciento
[1] 0.4744072
>
> # Probabilidad de que germinen a lo sumo 5 semillas:
> # A lo sumo se interpreta que germinen máximo 5 semillas
> k2=5
> pbinom(k2,n,p) # La probabilidad de que germinen a lo sumo 5 semillas,
es de 0.98 o del 98 por ciento
[1] 0.9802723
>
> # La esperanza de esta variable aleatoria:
> E=n*p
>E
[1] 2.5
> # La esperanza es de 2.5
>
> # La varianza de esta variable aleatoria
> V=n*p*(1-p)
>V
[1] 1.875
> # La varianza es de 1.875
>
> # Gráfico de distribución Binomial para el ejercicio de germinación de
semillas:
>
> x <- 0:n
> prob <- dbinom(x,n,p)
> barplot(prob,col = "red",names.arg=x,
+ xlab="Evento (germinación de x
semillas)",ylab="Probabilidad del evento",main="PERIODO 951 -
Distribución Binomial - Germinación de semillas\n(n=10,p=0.25)")
> #este gráfico muestra la probabilidad de ocurrencia de cada uno de los
11 eventos posibles, es decir que germinen 0 semillas, 1.., hasta 10.
> # En este caso, cuando p es menor que 0.5, la distribución se encuentra
sesgada positivamente hacia la izquierda
>
> # DISTRIBUCION DE POISSON
>
> # La distribución de Poisson se usa para distribuciones de variables
discretas (conteos)
>
> # EJERCICIO DE LAS PICADURAS DE GORGOJO, Libro Estadística y
Biometría de Mónica Balzarini, CAPITULO 3 - MODELOS
PROBABILÍSTICOS - Distribución Poisson, página 105:
> # Supongamos que el número promedio de picaduras de gorgojo por
semilla es 0.2 (es decir, que cada 100 semillas 20 tienen picaduras).
> # PROBABILIDAD DE UN VALOR EXACTO
> x1= 1 # Valor de conteo que se quiere calcular la probabilidad
> lamda=0.2 # En la distribución de Poisson lamda equivale a la media o
a la varianza, son el mismo valor
> dpois(x1,lamda) # La probabilidad de que en 100 semillas una tenga 1
picadura es de 0.1637 o de 16.37 por ciento
[1] 0.1637462
>
> ## DOS PICADURAS O MAS TOCA A UNO QUITARLE LAS
PROBABILIDADES DE CERO MAS LA DE UNO
> x0=0 # El valor de conteo que se quiere calcular la probabilidad, en
este caso que ninguna semilla tenga picaduras
> x2=1
> lamda=0.2 #media o varianza como es igual
> dpois(x0,lamda) # La probabilidad de que ninguna semilla tenga
picaduras es de 0.8187 o del 81.87 por ciento
[1] 0.8187308
> 1-(dpois(x0,lamda)+dpois(x2,lamda)) # 1 menos la SUMA de la
probabilidad de tener cero picaduras mas una picdura (x0+x2)
[1] 0.0175231
> # La probabilidad de que 2 de las 100 semillas tengan picaduras es de
0.0175 o del 1.8 por ciento

También podría gustarte