Está en la página 1de 47

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

VICERRECTORÍA ACADÉMICA Y DE INVESTIGACIÓN

Unidad 2 - Fase 3 - Distribución y probabilidad

Trabajo Colaborativo

Estadística descriptiva (para agrarias)


Código: 300046

Director de curso:
LUIS ALBERTO CÁCERES TORRES

Octubre de 2020
Introducción

El desarrollo de la siguiente actividad busca que los estudiantes conozcan sobre el concepto
de probabilidad el cual es cálculo matemático de las posibilidades que existen de que una cosa
se cumpla o suceda al azar. A través de la observación de características agropecuarias. Las
cuales son de suma importancia para el curso de Estadística Descriptiva de la UNAD.
Objetivo General:

Definir la probabilidad de ocurrencia de un evento determinado, proveniente de la


observación de una característica agropecuaria

Objetivos Específicos:

Aplicar conceptos básicos de probabilidad, como las variables aleatorias y las distribuciones
de probabilidad.

1. Revisar el OVI y los Contenidos y referentes bibliográficos de la Unidad 2, ubicados en


el Entorno de Aprendizaje y explicar en sus propias palabras los siguientes términos:

a) Espacio muestral, con qué letra se denota.


R / denotado E, S, Ω o U consiste en el conjunto de todos los posibles resultados de un
experimento aleatorio

b) Punto muestral.
R/ Es el conjunto de todos los posibles resultados de un experimento. En la definición
anterior, el espacio muestral Ω consta de n elementos (puntos muéstrales). Punto muestral
(ω). Es un elemento de Ω, es decir un resultado particular del experimento.

c) Evento muestral.
R/ Un evento o suceso es cualquier subconjunto del espacio muestral, llamándose a los
sucesos que contengan un único elemento sucesos elementales.

d) Variable aleatoria
R/ Una variable aleatoria es la función matemática de un experimento aleatorio.

e. ¿Qué significa que el espacio muestral de una variable aleatoria continua es no


contable?
R/ En cambio, el Espacio muestral continuo, y es al que refieres en tu pregunta, es cuando
la variabilidad obtenida, que es continua, simplemente no la podemos deducir. Por
ejemplo: las medidas de estatura de 100 personas. Puedes obtener: 1.3 m, 1.32 m…1.6m…
1.28m… Desconoces la variabilidad que vas a tener, además, no es muy exacta ¿Por qué?
Porque depende también del instrumento utilizado y el juicio del observador. Entonces tus
datos siempre son sujetos de error.

f. ¿Qué son variables aleatorias discretas proporcionales y que son variables


aleatorias discretas de conteo no acotado? De ejemplos de este tipo de variables.

R/ Cuando una variable solo es capaz de adquirir un número finito de valores dentro de un
intervalo se dice que es aleatoria discreta. Por ejemplo, las veces que ha llovido en la
ciudad este mes solo puede ser un valor igual o mayor a 0 y entero. Por ello también se
dice que estos valores pueden ser acotados o no. Un ejemplo de variable aleatoria discreta
de conteo no acotado es la cantidad de espermatozoides en una muestra de semen, por
cuanto se tratará de un valor discreto de tipo aleatorio y sin límites precisos.

g. Existen dos conceptos de probabilidad: el clásico y el concepto frecuencial; defina


cada uno.
R/
 Concepto de probabilidad clásica.

Es el número de resultados favorables a la presentación de un evento dividido entre el


número total de resultados posibles. Asignación de probabilidad "a priori", si necesidad de
realizar el experimento.

La probabilidad clásica o teórica se aplica cuando cada evento simple del espacio muestral
tiene la misma probabilidad de ocurrir.

 concepto frecuencial

La probabilidad frecuencial, también conocida como probabilidad frecuentista, refiere a


qué tan probable resulta un suceso si un experimento se repite muchas veces. Puede
entenderse como el cociente entre la cantidad de casos favorables y la cantidad de casos
posibles cuando la cantidad de casos tiende al infinito.

h. En caso de la probabilidad frecuencial, explique le experimento de germinación


de una semilla, cual es el experimento aleatorio, cual es el evento y cuantos puntos
muéstrales tiene.
R/ En un experimento de germinación de semillas, se dice que el experimento aleatorio es la
posibilidad de que las semillas germinen o no, el evento es “encontrar la semilla germinada”
representada con la letra A; entonces:
Si en el experimento de observaron 1000 semillas (N= 1000), donde N significa las veces
que se repitió en ensayo de germinación, y germinaron 400 semillas (n A=400); la
probabilidad de encontrar la semilla germinada es,
nA 400
P(A)= P (observar semilla germinada) = = = 0,4
N 1000
Donde las 400 semillas que germinaron son los puntos muestrales.

i. ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de probabilidad?


R/ como sabemos, la frecuencia absoluta es el número de veces que se repite un dato en un
experimento aleatorio y la frecuencia relativa, se obtiene al dividir la frecuencia absoluta
entre el número total de datos del experimento (n); cuando n es muy grande o tiende hacia el
infinito, la frecuencia relativa tiende a estabilizarse hacia un valor fijo. Por consiguiente, el
numero o valor fijo hacia el que tiende la frecuencia relativa al repetir el experimento
muchas veces, es lo que se conoce como probabilidad.

J. ¿Qué son eventos mutuamente excluyentes? ¿Cómo es la intersección de dos eventos


mutuamente excluyente? ¿si son excluyente, dado un evento A y uno B, a que es igual
P(A∪B)?
R/ Se dice que dos eventos son mutuamente excluyentes si cada uno está formado por
puntos muestrales distintos, es decir que la ocurrencia de un evento impide la ocurrencia del
otro evento. Su intersección es el conjunto vacío, es decir cero, A ∩ B = Ø. Por lo cual la
probabilidad de la unión de esos eventos P(A∪B), es la suma de las probabilidades de cada
evento.
P(A∪B) = P(A) + P(B)
k. En el caso de distribuciones de variables aleatorias, si una variable es continua y
simétrica, ¿qué modelo se usa?
R/ DISTRIBUCIÓN NORMAL
La distribución normal es la más importante de todas las distribuciones de probabilidad.Es
una distribución de variable continua con campo de variación [-¥ ,¥ ], que queda
especificada a través de dos parámetros ( que acaban siendo la media y la desviación típica
de la distribución).
Una variable aleatoria continua, X, definida en [-¥ ,¥ ] seguirá una distribución normal de
parámetros m y s , ( X ~ N(m ; s ) ) , si su función de densidad es :
a) Enorme número de fenómenos que puede modelizar: Casi todas las características
cuantitativas de las poblaciones muy grades tienden a aproximar su distribución a una
distribución normal.

b) Muchas de las demás distribuciones de uso frecuente, tienden a distribuirse según una
Normal, bajo ciertas condiciones.

c) (En virtud del teorema central del límite).Todas aquellas variables que pueden
considerarse causadas por un gran número de pequeños efectos (como pueden ser los
errores de medida) tienden a distribuirse según una distribución normal.

l. Para una variable de conteo no acotado, ¿qué modelo se utiliza?


R/ Para datos de conteo se suele utilizar la distribución Poisson como componente aleatorio
en el proceso de ajuste de un modelo lineal generalizado. Esta distribución se caracteriza
por la igualdad entre su media y su variancia, supuesto difícil de verificar ya que en la
práctica las observaciones de conteos frecuentemente exhiben una variabilidad que excede
la supuesta para una variable del tipo Poisson. El fenómeno por el cual un modelo lineal
generalizado tiene mayor variabilidad que la presupuesta por el componente aleatorio del
mismo se denomina sobre dispersión.

m. Para variables de proporciones ¿qué modelo se utiliza?


R/ DISTRIBUCIÓN HIPERGEOMÉTRICA

Dada la siguiente situación:

 Una población constituida por N individuos en total.


 De los cuales Np individuos son del tipo A , y Nq individuos son del tipo Ã.

De forma que la proporción de individuos A que hay en la población es p, y la proporción


de individuos de tipo Ã , es q (p+q=1).

 Se realizan n (pruebas) extracciones sin reemplazamiento

De forma que la probabilidad de extraer un individuo A ( Ã) en una de las extracciones


depende de los resultados de las pruebas anteriores.

 Si consideramos la variable aleatoria X = nº de resultados A obtenidos en las n


extracciones , X seguirá una distribución hipergeométrica. X~H(N,n,p)

Puede comprobarse que la función de cuantía es, entonces:


La distribución hipergeométrica es semejante a la binomial, excepto en el hecho de que las
pruebas no mantienen constantes las probabilidades de A y Ã

 La media de la distribución hipergeométrica es m = np


 La varianza de la distribución es s2 = npq (N-1/(N-n))

al término (N-1/(N-n)) se le llama coeficiente de exhaustividad ,o también, factor


corrector de poblaciones finitas :

Puede observarse que este factor es siempre inferior a 1 y que cuando la población es muy
grande (N® ¥ ) tiende a 1(por tanto si la población es muy grande la media y la varianza
coinciden con las de la D. Binomial).

De hecho, si la población es muy grande (resulta irrelevante la existencia o no de


reposición) la función de cuantía de la Hipergeométrica tiende a la f. de cuantía de la
distribución Binomial y se puede prescindir del hecho de que haya o no reemplazamiento.

n. ¿Qué variables tienen función de probabilidad y cuáles variables tienen función de


densidad?

R/ Las variables discretas presentan función de probabilidad, y las variables continuas


tienen función de densidad.

o. ¿Cuáles son los parámetros más usados en estadística para estudiar y utilizar
funciones de distribución de variables aleatorias?

R/ El valor esperado y la varianza son los parámetros más usados en estadística para
estudiar y utilizar funciones de distribución de variables aleatorias.

El Valor Esperado: formaliza la idea de valor medio de un fenómeno aleatorio.

La Varianza: formaliza la idea de incertidumbre y su recíproco la idea de precisión, más


varianza indica más incertidumbre sobre el fenómeno y menor precisión de las
conclusiones que podemos elaborar desde los datos que lo caracterizan.

p. ¿Qué es la esperanza matemática de una variable aleatoria, como se denota?

R/ Es el número que formaliza la idea de valor medio de un fenómeno aleatorio, se denota


como E(x).

¿Qué es la varianza de una variable aleatoria, como se denota?

La varianza de una variable aleatoria es una medida de dispersión definida como la


esperanza del cuadrado de la desviación de dicha variable respecto a su media. Se denota
como: σ2.

9. Abra “Código Fase 3 - DADOS.txt”, ejecútelo y responda las siguientes preguntas:


a. Explique en sus propias palabras el experimento aleatorio del dado. Este ejercicio nos ayudará
a entender los conceptos de probabilidad y distribución.
R/ En este ejercicio se obtiene un Espacio muestral Acotado ya que variable cuantitativa discreta
ya que entre eventos no va a existe eventos intermedios, también se presenta la probabilidad
clásica, al desarrollar esta probabilidad encontramos que la suma de los dados en 12 o menor que
12 lo que significa que es igual a 36/36

b. Adjunte en el informe los tres gráficos generados por el código (Frecuencias Absolutas,
frecuencias relativas y frecuencias relativas acumuladas). Adjunte un gráfico por diapositiva.

GRAFICA 1
PERIODO 764 - Gráfico de barras SUMA DE CARAS
6
5
Frecuencias absolutas

4
3
2
1
0

2 3 4 5 6 7 8 9 10 11 12
GRAFICA 2

PERIODO 764 - FRECUENCIAS RELATIVAS SUMA DE CARAS


0.20
0.15
Frecuencias relativas

0.10
0.05
0.00

2 3 4 5 6 7 8 9 10 11 12

GRAFICA 3
PERIODO 764 - FRECUENCIAS RELATIVAS ACUMULADAS SUMA DE CARAS
1.0
0.8
Frecuencias relativas

0.6
0.4
0.2
0.0

2 3 4 5 6 7 8 9 10 11 12

c. Haga una breve descripción y explicación de cada uno de los gráficos adjuntados. Recuerde
que no debe poner pantallazos en su informe, para presentar los gráficos debe hacer clic sobre el
gráfico con el botón derecho del mouse y seleccionar “Copiar como metafile” para
posteriormente pegarlo (“Control+V”) en su informe.

Grafico 1 frecuencia absoluta: esta grafica presenta un comportamiento de distribución norma,


la moda, la media y mediana se ubican en el centro y tiene la misma cantidad de datos a la
derecha y a la izquierda.
Grafico 2 frecuencia relativa: como es una frecuencia relativa aparecen los datos de forma
porcentual de los eventos.
Grafico 2 frecuencia acumulada: En esta grafica observamos que en el evento empiezan a
sumar las probabilidades por eso en el evento 12 se observa que están todas las probabilidades
acumulas de todos los 36 eventos en el espacio muestral.
10. Revise el documento de “Estadística y Biometría de Mónica Balzarini” (está disponible en la
carpeta de Google Drive indicada en el punto 2) y revise los siguientes ejercicios que se
encuentran en el Capítulo 3 – Modelos probabilísticos:

a. Distribución normal - Ejercicio de las vacas del tambo (página 91).

Ejercicio Vacas del tambo


Podemos observar que las gráficas obtenidas con el programa R coinciden con las
obtenidas en el libro dado que las condiciones iniciales no cambian. A las vacas se les da
una ración adicional para aumentar la producción de leche en 5 litros, pero la varianza no
se toca.

Datos procesados en R:

PERIODO 764 - Producción de leche Función de Distribución NPERIODO 764 - Producción


(misma varianza, de leche Función de Distribución N (misma varianza, distinta media
distinta media
0.12
0.12

0.10
0.10

0.08
0.08

F(x)
F(x)

0.06
0.06

0.04
0.04

0.02
0.02

0.00
0.00

10 15 20 25 30 35 40 10 15 20 25 30 35 40

Producción de leche (litros/día) Producción de leche (litros/día)


PERIODO 764 - Producción de leche Función de Distribución N (misma media, distinta varianza
0.4
0.3
F(x)

0.2
0.1
0.0

10 15 20 25 30 35 40

Producción de leche (litros/día)

Teniendo en cuenta los datos suministrados por el libro podemos observar como la
gráfica cambia al modificar la varianza, en este caso reduciéndola.

Función de Distribución N(media.sigma)


0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

PROBABILIDAD que el rendimiento se encuentre en el intervalo de 50 a 65 qq/Ha


0.685911 que es igual a los resultados obtenidos en el libro
b. Probabilidad en distribución normal - Ejercicio del híbrido de maíz (página 93).

Ejercicio del híbrido de maíz

Resultados del libro

PERIODO 764 - Rendimiento de maíz - Función de Distribución N(media.sigma)


0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Rendimiento (qq/Ha)
Función de Distribución N(media.sigma)
0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

PROBABILIDAD que el rendimiento se encuentre en el intervalo de 50 a 65 qq/Ha


c. Distribución binomial - Ejercicio de la semilla de Panicum sp. (página 102).

Ejercicio de la semilla de panicum


La distribución Binomial puede usarse para el cálculo de probabilidades de eventos provenientes
de conteos acotados. Se supone que se realizan cierto número (n) de experimentos aleatorios y en
cada experimento se registra uno de dos resultados posibles, éxito o fracaso donde el éxito tiene
una cierta probabilidad (P) de ocurrencia (este ensayo con resultado binario se conoce como
ensayo Bernoulli)

dbinom(k,n,p) # PROBABILIDAD DE UN VALOR IGUAL P(X=7), "que germinen siete


semillas"
[1] 0.003089905
Probabilidad de que germinen menos de 3 semillas
[1] 0.5255928

Para conocer la probabilidad que germinen 3 o mas semillas se resta 1 menos el anterior
resultado:
> 1-pbinom(k1,n,p) # La probabilidad de que germinen 3 o más semillas es de 0.4744 o del
47.44 por ciento
[1] 0.4744072

# Probabilidad de que germinen a lo sumo 5 semillas:


> # A lo sumo se interpreta que germinen máximo 5 semillas
> k2=5
> pbinom(k2,n,p) # La probabilidad de que germinen a lo sumo 5 semillas, es de 0.98 o del 98
por ciento
[1] 0.9802723

# La esperanza de esta variable aleatoria:


> E=n*p
>E # La esperanza es de 2.5
[1] 2.5

# La vaarianza de esta variable aleatoria


> V=n*p*(1-p)
>V # La varianza es de 1.875
[1] 1.875

PERIODO 764 - Distribución Binomial - Germinación de semillas


(n=10,p=0.25)
0.25
0.20
Probabilidad del evento

0.15
0.10
0.05
0.00

0 1 2 3 4 5 6 7 8 9 10

Evento (germinación de x semillas)

d. Distribución Poisson - Ejercicio de las picaduras de gorgojo (página 105).

Distribución Poisson

La distribución de Poisson también sirve como modelo probabilístico para variables discretas de
tipo conteo. A diferencia de la Binomial, donde el conteo se realizaba sobre n experimentos
independientes, en el caso de la Poisson, los conteos se refieren al número de veces que un
evento ocurre en una unidad de tiempo o espacio dada (hora, kilo, m2, m3, planta, etc.) y por
tanto los valores de la variable no están acotados. Es decir, mientras los valores de Y en una
Binomial podían pertenecer a los naturales entre 0 y n inclusive, en el caso de una Poisson
pueden pertenecer a los naturales entre 0 e infinito.

> dpois(x1,lamda) # La probabilidad de que en 100 semillas una tenga 1 picadura es de


0.1637 o de 16.37 por ciento
[1] 0.1637462
>
> ## DOS PICADURAS O MAS TOCA A UNO QUITARLE LAS PROBABILIDADES
DE CERO MAS LA DE UNO
> x0=0 # El valor de conteo que se quiere calcular la probabilidad, en este caso que
ninguna semilla tenga picaduras
> x2=1
> lamda=0.2 #media o varianza como es igual
> dpois(x0,lamda) # La probabilidad de que ninguna semilla tenga picaduras es de
0.8187 o del 81.87 por ciento
[1] 0.8187308
> 1-(dpois(x0,lamda)+dpois(x2,lamda)) # 1 menos la SUMA de la probabilidad de
tener cero picaduras mas una picdura (x0+x2)
[1] 0.0175231
> # La probabilidad de que 2 de las 100 semillas tengan picaduras es de 0.0175 o del 1.8
por ciento

13. Presente las siguientes gráficas obtenidas con el “Código Fase 3 –


MODELOS.txt”:

a. "Producción de leche - Función de Distribución N (misma varianza, distinta media)".


Este gráfico muestra dos distribuciones dentro de la misma gráfica -una azul y otra roja-,
para obtenerlo, cuando aparezca la gráfica de distribución de color azul, NO LA
CIERRE, continúe ejecutando el código (para volver al código, ubique el cursor en el
marco azul, donde aparece el nombre del código, para que no pierda la secuencia de
ejecución).
PERIODO 764 - Producción de leche Función de Distribución N (misma varianza, distinta media
0.12
0.10
0.08
F(x)

0.06
0.04
0.02
0.00

La esperanza es de 25 litros de10


leche y15la varianza
20 es 25
9 litros.30 35 40

Producción de leche (litros/día)


Fuente: Estadística Y Biometría Balzaniri, Modelos Probabilísticos, pág. 91.

PERIODO 764 - Producción de leche Función de Distribución N (misma varianza, distinta media
0.12
0.10
0.08
F(x)

0.06
0.04
0.02
0.00

10 15 20 25 30 35 40

Producción de leche (litros/día)

La esperanza es de 25 litros de leche (azul) y 30 litros de leche (rojo) y la varianza es 9 litros


igual.

Fuente: Estadística Y Biometría Balzaniri, Modelos Probabilísticos, pág. 91.


b. "Producción de leche - Función de Distribución N (misma media, distinta varianza". Al igual
que el anterior, muestra dos distribuciones en la misma gráfica, cada una con distinta varianza,
cuando le aparezca el primer gráfico (color azul) no lo cierre y continúe ejecutando el código
hasta que le aparezca la segunda línea de distribución (color rojo).

PERIODO 764 - Producción de leche Función de Distribución N (misma media, distinta varianza
0.4
0.3
F(x)

0.2
0.1
0.0

10 15 20 25 30 35 40

Producción de leche (litros/día)

La esperanza es 25 litros de leche, pero la varianza cambia a 2 litros.

Fuente: Estadística Y Biometría Balzaniri, Modelos Probabilísticos, pág. 92.


PERIODO 764 - Producción de leche Función de Distribución N (misma media, distinta varianza
0.4
0.3
F(x)

0.2
0.1
0.0

10 15 20 25 30 35 40

Producción de leche (litros/día)

La esperanza es de 25 litros de leche, pero la varianza es 9 litros (rojo) y 2 litros (azul).

Fuente: Estadística Y Biometría Balzaniri, Modelos Probabilísticos, pág. 92.


c. Rendimiento de maíz - Función de Distribución N(media.sigma). Por favor indique en la
descripción del gráfico cuáles son los valores de media y sigma.

PERIODO 764 - Rendimiento de maíz - Función de Distribución N(media.sigma)


0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Rendimiento (qq/Ha)

La grafica representa el rendimiento de un hibrido de maíz con esperanza (media) de 60 qq/Ha


con una varianza (sigma) de 49 (qq/Ha)2

Fuente: Estadística Y Biometría Balzaniri, Modelos Probabilísticos, pág. 93.


d. Rendimiento de maíz - Distribución Normal con área bajo la curva. Cuando le aparezca el
gráfico no lo cierre, continúe ejecutando el código para que sobre este aparezca el área bajo la
curva. En la descripción del gráfico especifique el rango de rendimiento de la región que aparece
sombreada en el gráfico.

PERIODO 764 - Rendimiento de maíz Distribución Normal con área bajo la curva
0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Rendimiento (qq/Ha)

La probabilidad de obtener un rendimiento de maíz está comprendida en el intervalo 50 a 65


qq/ha, la cual está representada por el área sombreada color naranja y es igual a la proporción de
la superficie del área respecto al área total bajo la curva.
A = P (50≤ Y ≤ 65)

Fuente: Estadística Y Biometría Balzaniri, Modelos Probabilísticos, pág. 94.


e. "Distribución Binomial Germinación de semillas\n(n=10,p=0.25)". Explique qué significa
cada una de las barras y por qué no se encuentra la mayor probabilidad hacia el centro del
gráfico.

PERIODO 764 - Distribución Binomial - Germinación de semillas


(n=10,p=0.25)
0.25
0.20
Probabilidad del evento

0.15
0.10
0.05
0.00

0 1 2 3 4 5 6 7 8 9 10

Evento (germinación de x semillas)

Con base a la gráfica podemos afirmar:


El evento 0 tiene una probabilidad de germinación aproximada de 0.05 %
El evento 1 tiene una probabilidad de germinación aproximada de 0.20 %
El evento 2 tiene una probabilidad de germinación superior de 0.25 %
El evento 3 tiene una probabilidad de germinación del 0.25 %
El evento 4 tiene una probabilidad de germinación aproximada de 0.15 %
El evento 5 tiene una probabilidad de germinación aproximada de 0.05 %
El evento 6 tiene una probabilidad de germinación inferior de 0.05 %
El evento 7 tiene una probabilidad de germinación mínima por debajo de 0.03 %
El evento 8,9 y 10 no tienen probabilidad de germinación - 0.00 %
Además, la mayor probabilidad de germinación de las semillas no se encuentra ubicada hacia el
centro de la gráfica, porque p=0.25, es decir, está por debajo de 0,5 por lo tanto la distribución se
inclina hacia la izquierda.

14. Lea el Capítulo 3 – Modelos probabilísticos del libro Estadística y Biometría de Mónica
Balzarini y responda las siguientes preguntas:

a. Qué tipo de histograma se debe seleccionar en un modelo probabilístico para una


variable aleatoria continua cuando se tienen datos de esa variable

Para una variable aleatoria continua cuando se tienen datos de esa variable, resulta
recomendable graficar un histograma de frecuencias relativas y observar la forma del
mismo

b. Que es la estandarización, cuál es su fórmula

La estandarización nos permite llevar cualquier distribución normal a la distribución normal


estándar

c. Qué tipo de conteos se trabajan con la distribución Binomial

Puede usarse para el cálculo de probabilidades de eventos provenientes de conteos acotados

d. En la distribución binomial que es n y que es P

Se supone que se realizan cierto número (n) de experimentos aleatorios y en cada experimento
se registra uno de dos resultados posibles, éxito o fracaso donde el éxito tiene una cierta
probabilidad (P) de ocurrencia
e. Qué es igual la esperanza y la varianza en la distribución binomial.

La esperanza y la varianza binomial B (n, p) podemos calcular la esperanza y la varianza de la


variable correspondiente a un ensayo y después aplicar las propiedades generales de dichos
parámetros con respecto a la suma de variables independientes.

f. Mencione ejemplos en su área de estudio donde se podría utilizar la distribución


Binomial.

La probabilidad que a un cliente le guste la leche de cabra saborizada 0.59 si llegan 10


clientes, cual es la probabilidad que les guste a 6 clientes este ejemplo nos sirve para
observar el éxito de este producto nuevo.

Si se sembraran 3 tipos de pasto para producción de leche donde la probabilidad que


germinen es de 0.65 cuál es la posibilidad que 2 de ellos nazcan en la finca. En este ejemplo
podemos observar el éxito o fracaso que se puede tener el combinado ciertos pastos.

Si por ejemplo le vamos a implantar un nuevo alimento con base de pastos de corte, para la
producción de leche que probabilidad hay que a la mitad de las vacas aumenten su
productividad.

g. Qué tipos de conteos se trabajan con la distribución de Poisson.

La distribución de poission también sirve como modelo probabilístico para variables


discretas de tipo conteo. A diferencia de la binominal los conteos se refieren al número de
veces que un evento ocurre en una unidad de tiempo o espacio dada (hora, kilo, m2, m3,
planta, etc.) y por lo tanto los valores de la variable no están acotados.

h. Cómo se denota el único parámetro de la distribución de Poisson.

El parámetro de la distribución de poisson es (

i. ¿A qué es igual la media y la varianza en la distribución de Poisson?


La propiedad de esperanza igual o varianza de la distribución poisson implica que el aumentar el
promedio de los conteos, aumenta también su varianza. La varianza de una poisson es la función de
la media.

j. Mencione ejemplos en su área de estudio donde se podría utilizar la distribución de Poisson.

 El número de paracitos externos que se encuentran en un animal de granja.


 El número de pacientes que llegan a una veterinaria en día.
 El número de vacas con mastitis bovina en un acto lechero.
 El número de huevos en un galpón en un día.
CONCLUSIONES

El modelo de probabilidad normal es muy utilizado en el área de agronomía y las ciencias


biológicas, y este usa histogramas de frecuencia de variables. Este modelo lo aplicamos en los
ejercicios de producción de leche.

La distribución binomial se suele representar como (n, p), donde n representa el número de
experimentos y p la probabilidad de éxito.

En el ejercicio de germinación de semillas el resultado obtenido en cada experimento es


independiente del anterior, es decir, lo que ocurre en un experimento no afecta al siguiente.
Igualmente, los sucesos son mutuamente excluyentes, es decir, no pueden ocurrir los 2 al mismo
tiempo. Las semillas pueden germinar o no germinar.
BIBLIOGRAFÍAS

 Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en


problemas de agronomía. Recuperado de
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?docID=322177
5&query=bioestadística
 Walpole, R.E.; Myers, R.H.; Myers, S.L. & Ye, K. “Probabilidad y estadística para
ingeniería y ciencias”. Octava Edición. Pearson Prentice-Hall. México, 2007. V
 Material docente de la Unidad de Bioestadística Clínica.
URL: http://www.hrc.es/bioest/M_docente.html
 Iniciación a la Estadística. URL:
http://descartes.cnice.mecd.es/Estadistica/iniciacion_estadististica_fjgarcia/FGG990_UD.
htm
 Estadística Descriptiva y Probabilidad. URL: http://thales.cica.es/rd/Recursos/rd99/ed99-
0278- 01/indice.html.
 Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat
en problemas de agronomía. Recuperado de
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?
docID=3221775&query=bioestadística

 Probabilidad. Consultado (12/10/2020). Disponible en
http://recursostic.educacion.es/secundaria/edad/4esomatematicasB/probabilidad/quincena
12_contenidos_2b.htm
> # EXPERIMENTO ALEATORIO LANZAR DOS DADOS - PERIODO 764
>
> # Hay 36 posibles resultados, que da de combinar cada número con los demás
> # Iniciamos con el número 1 en el primer dado y lo vamos combinando con las seis
posibles opciones del segundo dado (1,2,3,4,5,6)
> # Hacemos lo mismo con el número 2 del primer dado y las seis combinaciones que
puede haber con el segundo y así sucesivamente,
> # hasta obtener una matriz de ESPACIO MUESTRAL como se presenta a
continuación:
> #(1,1), (1,2), (1,3), (1,4), (1,5), (1,6),
> #(2,1), (2,2), (2,3), (2,4), (2,5), (2,6),
> #(3,1), (3,2), (3,3), (3,4), (3,5), (3,6),
> #(4,1), (4,2), (4,3), (4,4), (4,5), (4,6),
> #(5,1), (5,2), (5,3), (5,4), (5,5), (5,6),
> #(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}
>
> # VEMOS QUE HAY 36 RESULTADOS POSIBLES, POR TANTO ESTE ES EL
ESPACIO MUESTRAL
> # La probabilidad siempre tendrá denominador 36 (x/36)
> # PUNTOS MUESTRALES = 36
> # Los eventos son subconjuntos del espacio muestral (los 36 posibles resultados del
dado)
> # Por ejemplo, un evento puede ser que en ambos dados salgan números pares (2,2
4,4 6,6)
> # Otro evento puede ser sacar dos números iguales, en donde se tendrían los
siguientes posibles resultados:
> # POSIBLE RESULTADOS: (1,1),(2,2),(3,3),(4,4),(5,5),(6,6)
> # En este caso habrían 6 resultados de éxito de los 36 posibles del espacio muestral.
> # La probabilidad por tanto de obtener dos números iguales sería: 6/36 = 0.166 O
16,6% en términos porcentuales
>
> # VARIABLE ALEATORIA Y = SUMA DE VALORES
> # Es otra forma de presentar los 36 posibles eventos del espacio muestral, en donde
se suman los valores obtenidos en cada dado:
>
> #(2), (3), (4), (5), (6), (7),
> #(3), (4), (5), (6), (7), (8),
> #(4), (5), (6), (7), (8), (9),
> #(5), (6), (7), (8), (9), (10),
> #(6), (7), (8), (9), (10), (11),
> #(7), (8), (9), (10), (11), (12)
>
> # De esta forma se puede procesar su análisis en el programa R
>
> PROCESAMIENTO EN R
Error: unexpected symbol in " PROCESAMIENTO EN"
>
> # Creamos el vector con los datos sumando los valores de cada dado, como se indicó
anteriormente
> # EJEMPLO:
> # (1,1),(1,2),(1,3),(1,4),(1,5),(1,6)
> # Sumando quedará: 2, 3, 4, 5, 6, 7 y así sucesivamente hasta llegar al último evento
(6,6):
>
> SUMADADOS=c(2, 3, 4, 5, 6, 7,
+ 3, 4, 5, 6, 7, 8,
+ 4, 5, 6, 7, 8, 9,
+ 5, 6, 7, 8, 9, 10,
+ 6, 7, 8, 9, 10, 11,
+ 7, 8, 9, 10, 11, 12)
>
> # TABLAS DE FRECUENCIAS PARA LA VARIABLE DISCRETA "SUMADADOS":
>
> # En este caso las tabla de frecuencias se desarrollan por pasos:
>
> table(SUMADADOS) # Tabla de frecuencias absolutas
SUMADADOS
2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
> fabs=table(SUMADADOS) # Asignación al comando de Tabla de
frecuencias absolutas el nombre: "fabs"
> fabs
SUMADADOS
2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
> fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas
> fabsacum
2 3 4 5 6 7 8 9 10 11 12
1 3 6 10 15 21 26 30 33 35 36
> frel=prop.table(table(SUMADADOS)) # Asignación al comando de Tabla de
frecuencias relativas el nombre: "frel"
> frel # Tabla de frecuencias relativas
SUMADADOS
2 3 4 5 6 7 8
0.02777778 0.05555556 0.08333333 0.11111111 0.13888889 0.16666667 0.13888889
9 10 11 12
0.11111111 0.08333333 0.05555556 0.02777778
> # Podemos decir entonces que la probabilidad que la suma de las dos caras sea
igual a 2 es del 0.027 o 2.7% en términos porcentuales.
> # Las probabilidades se multiplican por 100 para expresarlas en porcentaje.
>
> frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
> frelacum
2 3 4 5 6 7 8
0.02777778 0.08333333 0.16666667 0.27777778 0.41666667 0.58333333 0.72222222
9 10 11 12
0.83333333 0.91666667 0.97222222 1.00000000
> # En este caso, la probabilidad de obtener un valor mayor o igual a 2 pero menor de
4 es de 0.083 o 8.3%
> # es lo mismo que sumar la probabilidad de obtener un valor de 2 (0.027) y de 3
(0.055) = 0.083
>
> # GRAFICOS DE FRECUENCIAS:
>
> barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 764 - Gráfico de barras
SUMA DE CARAS") # Gráfico de Frecuencias absolutas
> barplot(frel,ylab="Frecuencias relativas",ylim=c(0,0.2),xlim=c(0,12),main="PERIODO
764 - FRECUENCIAS RELATIVAS SUMA DE CARAS") # Gráfico de Frecuencias
relativas
> barplot(frelacum,ylab="Frecuencias relativas",main="PERIODO 764 - FRECUENCIAS
RELATIVAS ACUMULADAS SUMA DE CARAS") # Gráfico de Frecuencias relativas
acumuladas
>
>
>
>
>

R version 4.0.2 (2020-06-22) -- "Taking Off Again"


Copyright (C) 2020 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)

R es un software libre y viene sin GARANTIA ALGUNA.


Usted puede redistribuirlo bajo ciertas circunstancias.
Escriba 'license()' o 'licence()' para detalles de distribucion.

R es un proyecto colaborativo con muchos contribuyentes.


Escriba 'contributors()' para obtener más información y
'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,


o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.
Escriba 'q()' para salir de R.

[Previously saved workspace restored]

> # MODELOS DE DISTRIBUCIONES - PERIODO 764


>
> # DISTRIBUCION NORMAL
> # EJERCIO DE LAS VACAS DEL TAMBO, Libro Estadística y Biometría de Mónica
Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución normal, página
91
> # La producción de leche diaria de las vacas de un tambo se distribuye como el
modelo normal, con esperanza 25 litros (que es la misma media) y varianza de 9 litros
al cuadrado:
> MEDIA=25
> VARIANZA=9
> # A las vacas se les da una nueva ración que aumenta su producción en 5 litros, pero
no cambia la varianza, ya que son los mismos animales:
> MEDIA2=30
> SIGMA=sqrt(VARIANZA)
> x=seq(15,40,by=0.5) #secuencia de valores en un un rango de producción de leche
de 15 a 40 litros
> dnorm(x,MEDIA,SIGMA)
[1] 5.140930e-04 8.836587e-04 1.477283e-03 2.402033e-03 3.798662e-03
[6] 5.842767e-03 8.740630e-03 1.271754e-02 1.799699e-02 2.477039e-02
[11] 3.315905e-02 4.317253e-02 5.467002e-02 6.733290e-02 8.065691e-02
[16] 9.397063e-02 1.064827e-01 1.173551e-01 1.257944e-01 1.311466e-01
[21] 1.329808e-01 1.311466e-01 1.257944e-01 1.173551e-01 1.064827e-01
[26] 9.397063e-02 8.065691e-02 6.733290e-02 5.467002e-02 4.317253e-02
[31] 3.315905e-02 2.477039e-02 1.799699e-02 1.271754e-02 8.740630e-03
[36] 5.842767e-03 3.798662e-03 2.402033e-03 1.477283e-03 8.836587e-04
[41] 5.140930e-04 2.908942e-04 1.600902e-04 8.569012e-05 4.461008e-05
[46] 2.258767e-05 1.112362e-05 5.327914e-06 2.482015e-06 1.124574e-06
[51] 4.955732e-07
>
> # Gráfico de distribución normal con media = 25 y varianza = 9
> # POR FAVOR NO LO CIERRE, ya que sobre este mismo aparecerá el siguiente
gráfico (continúe ejecutando el código)
> # Cuando aparezca el gráfico, seleccione nuevamente el código de ejecución (Editor
R) ubicando el cursor en el MARCO AZUL, donde aparece el nombre del código
> # De esta forma, mantendrá el orden de ejecución dentro del código:
>
> curve(dnorm(x,MEDIA,SIGMA),xlim=c(10,40),col="blue",lwd=2,
+ xlab="Producción de leche (litros/día)",ylab="F(x)",main="PERIODO 764 -
Producción de leche Función de Distribución N (misma varianza, distinta media")
>
> # Gráfico de distribución normal con media = 30 y varianza = 9
> # Este gráfico (de color rojo) le debe aparecer junto con el anterior gráfico de color
azul, en la misma gráfica:
>
> curve(dnorm(x,MEDIA2,SIGMA),xlim=c(10,40), add=TRUE, col="red", lwd=2)
>
>
> # se puede observar que cambia la ubicación de la media (esperanza), pero la forma
de ambas gráficas es la misma porque no cambió la varianza
>
> # Ahora se realiza el mismo procedimiento pero en este caso no cambia la media
(esperanza) sino las varianzas:
>
> MEDIA=25
> VARIANZA=9
> VARIANZA1=2
> SIGMA=sqrt(VARIANZA)
> SIGMA1=sqrt(VARIANZA1)
> x=seq(15,40,by=0.5)
> dnorm(x,MEDIA,SIGMA)
[1] 5.140930e-04 8.836587e-04 1.477283e-03 2.402033e-03 3.798662e-03
[6] 5.842767e-03 8.740630e-03 1.271754e-02 1.799699e-02 2.477039e-02
[11] 3.315905e-02 4.317253e-02 5.467002e-02 6.733290e-02 8.065691e-02
[16] 9.397063e-02 1.064827e-01 1.173551e-01 1.257944e-01 1.311466e-01
[21] 1.329808e-01 1.311466e-01 1.257944e-01 1.173551e-01 1.064827e-01
[26] 9.397063e-02 8.065691e-02 6.733290e-02 5.467002e-02 4.317253e-02
[31] 3.315905e-02 2.477039e-02 1.799699e-02 1.271754e-02 8.740630e-03
[36] 5.842767e-03 3.798662e-03 2.402033e-03 1.477283e-03 8.836587e-04
[41] 5.140930e-04 2.908942e-04 1.600902e-04 8.569012e-05 4.461008e-05
[46] 2.258767e-05 1.112362e-05 5.327914e-06 2.482015e-06 1.124574e-06
[51] 4.955732e-07
>
> # Gráfico de distribución normal con media = 25 y varianza = 9
> # POR FAVOR NO LO CIERRE, ya que sobre este mismo aparecerá el siguiente
gráfico (continúe ejecutando el código)
>
> curve(dnorm(x,MEDIA,SIGMA),xlim=c(10,40),ylim=c(0,0.4),col="blue",lwd=2,
+ xlab="Producción de leche (litros/día)",ylab="F(x)",main="PERIODO 764 -
Producción de leche Función de Distribución N (misma media, distinta varianza")
>
> # Gráfico de distribución normal con media = 25 y varianza = 2
> # Este gráfico (de color rojo) le debe aparecer junto con el anterior gráfico de color
azul, en la misma gráfica:
>
> curve(dnorm(x,MEDIA,SIGMA1),xlim=c(10,40), add=TRUE, col="red", lwd=2)
>
> # En este caso ambas gráficas tienen la misma media (o esperanza) pero sus formas
cambiaron porque tienen distinta varianza
> # A mayor varianza, la gráfica tendrá mayor amplitud
>
> # EJERCICIO DE HIBRIDO MAIZ, Libro Estadística y Biometría de Mónica Balzarini,
CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución normal, página 93
>
> # Si Y es el rendimiento de un híbrido de maíz que puede modelarse con una
distribución normal, con media de 60 qq/Ha y varianza de 49 qq/Ha:
> media= 60
> varianza= 49
> sigma=sqrt(varianza)
> sigma
[1] 7
> X=seq(35,85,by=0.5) # Secuencia de valores en un un rango de 35 a 85 qq/Ha
> dnorm(X,media,sigma)
[1] 9.684491e-05 1.246690e-04 1.596703e-04 2.034576e-04 2.579337e-04
[6] 3.253318e-04 4.082527e-04 5.097014e-04 6.331212e-04 7.824238e-04
[11] 9.620142e-04 1.176807e-03 1.432231e-03 1.734223e-03 2.089206e-03
[16] 2.504043e-03 2.985977e-03 3.542545e-03 4.181465e-03 4.910501e-03
[21] 5.737297e-03 6.669190e-03 7.712995e-03 8.874773e-03 1.015958e-02
[26] 1.157120e-02 1.311188e-02 1.478210e-02 1.658026e-02 1.850251e-02
[31] 2.054255e-02 2.269145e-02 2.493758e-02 2.726658e-02 2.966137e-02
[36] 3.210228e-02 3.456725e-02 3.703206e-02 3.947074e-02 4.185592e-02
[41] 4.415934e-02 4.635244e-02 4.840685e-02 5.029505e-02 5.199096e-02
[46] 5.347055e-02 5.471239e-02 5.569818e-02 5.641316e-02 5.684655e-02
[51] 5.699175e-02 5.684655e-02 5.641316e-02 5.569818e-02 5.471239e-02
[56] 5.347055e-02 5.199096e-02 5.029505e-02 4.840685e-02 4.635244e-02
[61] 4.415934e-02 4.185592e-02 3.947074e-02 3.703206e-02 3.456725e-02
[66] 3.210228e-02 2.966137e-02 2.726658e-02 2.493758e-02 2.269145e-02
[71] 2.054255e-02 1.850251e-02 1.658026e-02 1.478210e-02 1.311188e-02
[76] 1.157120e-02 1.015958e-02 8.874773e-03 7.712995e-03 6.669190e-03
[81] 5.737297e-03 4.910501e-03 4.181465e-03 3.542545e-03 2.985977e-03
[86] 2.504043e-03 2.089206e-03 1.734223e-03 1.432231e-03 1.176807e-03
[91] 9.620142e-04 7.824238e-04 6.331212e-04 5.097014e-04 4.082527e-04
[96] 3.253318e-04 2.579337e-04 2.034576e-04 1.596703e-04 1.246690e-04
[101] 9.684491e-05
>
> # Gráfico de distribución normal con media = 60 y varianza = 49
>
> curve(dnorm(x,media,sigma),xlim=c(20,100),col="blue",lwd=2,
+ xlab="Rendimiento (qq/Ha)",ylab="F(x)",main="PERIODO 764 - Rendimiento de
maíz - Función de Distribución N(media.sigma)")
>
> # Especificamos el valor del que queremos saber su probabilidad, en este caso, 50:
> valor=50
> pnorm(valor,media,sigma)
[1] 0.07656373
>
> # Quiere decir que la probabilidad de que el rendimiento esté por debajo de 50 qq/Ha
es de 0.0765 o del 7.65 por ciento
>
> #PROBABILIDAD DE UN VALOR MAYOR
> valor=50
> # Para hallar la probabilidad de un valor mayor que 50, se resta 1 menos la
probabilidad de hallar un valor igual o menor:
>
> 1-pnorm(valor,media,sigma)
[1] 0.9234363
> # En este caso, la probabilidad de que el rendimiento esté por encima de 50 qq/Ha,
es de 0.923 o 92.3 por ciento.
>
> # PROBABILIDAD EN UN RANGO DE VALORES
>
> # Probabilidad que un dato de rendimiento tomado al azar esté comprendido en el
intervalo de 50 a 65 qq/Ha:
> # Reemplaze por el rango de valores, valor 2 es el mayor y valor 1 es el menor:
> valor1=50
> valor2=65
> VALOR1=pnorm(valor1,media,sigma)
> VALOR1
[1] 0.07656373
> VALOR2=pnorm(valor2,media,sigma)
> VALOR2
[1] 0.7624747
>
> # PROBABILIDAD que el rendimiento se encuentre en el intervalo de 50 a 65 qq/Ha:
> VALOR2-VALOR1
[1] 0.685911
>
> # Se resta la probabilidad de que el rendimiento esté por debajo de 65 qq/Ha
(p=0.762), menos la probabilidad de que esté por debajo de 50 qq/Ha (0.0765)
>
> regionX=seq(valor1,valor2,0.01) # Intervalo a sombrear
>
> # GRAFICA DE ÁREA BAJO LA CURVA ENTRE 50 Y 65 qq/Ha
>
> xP <- c(valor1,regionX,valor2) # Base de los polígonos que crean el efecto
"sombra"
> yP <- c(0,dnorm(regionX,media,sigma),0) # Altura de los polígonos sombreados
>
> # Cuando le abra la gráfica no la cierre y vuelva al Editor R, seleccionando el marco
azul del cuadro, donde aparece el nombre del código
> curve(dnorm(x,media,sigma),xlim=c(20,100),col="blue",lwd=2,
+ xlab="Rendimiento (qq/Ha)",ylab="F(x)",main="PERIODO 764 - Rendimiento de
maíz Distribución Normal con área bajo la curva")
> polygon(xP,yP,col="orange1") # Área bajo la curva entre 50 y 65 qq/Ha
> box() # Crea un marco rodeando el área bajo la curva
>
> # DISTRIBUCION BINOMIAL
> # Ejercicio de la semilla de Panicum, Libro Estadística y Biometría de Mónica
Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución binomial,
página 101:
> # Debe presentar estos resultados en su informe:
>
> # Supóngase que se toman 10 semillas de Panicum sp y se registra el evento
"Germinó"o "No germinó",después de 5 días desde su implantación:
> k= 7 # Queremos saber la probabilidad que germinen 7 de las 10 semillas
> n= 10 # Número total de ensayos realizados, en este caso son 10, que fueron el
número de semillas evaluadas
> p= 0.25 # La probabilidad de germinación de las semillas fue del 25 por ciento
>
> dbinom(k,n,p) # PROBABILIDAD DE UN VALOR IGUAL P(X=7), "que germinen
siete semillas"
[1] 0.003089905
>
> # Probabilidad que germinen al menos 3 de las 10 semillas:
> # En este caso, se interpreta como la probabilidad de que germinen tres o más
semillas
> # Es equivalente a la probabilidad que germinen 3 semillas, más la probabilidad que
germinen 4, más la prob. que germinen 5; y así sucesivamente hasta 10.
> # Otra forma de calcularlo es a la inversa, calculando la probabilidad que germinen
menos de 3 y restándole a la probabilidad total:
>
> k1=2 # Hay que calcular la probabilidad de un valor que sea una unidad menor
que el que queremos hallar
>
> pbinom(k1,n,p) # esta es la probabilidad de que germinen menos de 3 semillas
[1] 0.5255928
>
> #Para conocer la probabilidad que germinen 3 o más semillas se resta 1 menos el
anterior resultado:
> 1-pbinom(k1,n,p) # La probabilidad de que germinen 3 o más semillas es de 0.4744
o del 47.44 por ciento
[1] 0.4744072
>
> # Probabilidad de que germinen a lo sumo 5 semillas:
> # A lo sumo se interpreta que germinen máximo 5 semillas
> k2=5
> pbinom(k2,n,p) # La probabilidad de que germinen a lo sumo 5 semillas, es de 0.98
o del 98 por ciento
[1] 0.9802723
>
> # La esperanza de esta variable aleatoria:
> E=n*p
>E
[1] 2.5
> # La esperanza es de 2.5
>
> # La varianza de esta variable aleatoria
> V=n*p*(1-p)
>V
[1] 1.875
> # La varianza es de 1.875
>
> # Gráfico de distribución Binomial para el ejercicio de germinación de semillas:
>
> x <- 0:n
> prob <- dbinom(x,n,p)
> barplot(prob,col = "red",names.arg=x,
+ xlab="Evento (germinación de x semillas)",ylab="Probabilidad del
evento",main="PERIODO 764 - Distribución Binomial - Germinación de
semillas\n(n=10,p=0.25)")
> #este gráfico muestra la probabilidad de ocurrencia de cada uno de los 11 eventos
posibles, es decir que germinen 0 semillas, 1.., hasta 10.
> # En este caso, cuando p es menor que 0.5, la distribución se encuentra sesgada
positivamente hacia la izquierda
>
> # DISTRIBUCION DE POISSON
>
> # La distribución de Poisson se usa para distribuciones de variables discretas
(conteos)
>
> # EJERCICIO DE LAS PICADURAS DE GORGOJO, Libro Estadística y Biometría de
Mónica Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución
Poisson, página 105:
> # Supongamos que el número promedio de picaduras de gorgojo por semilla es 0.2
(es decir, que cada 100 semillas 20 tienen picaduras).
> # PROBABILIDAD DE UN VALOR EXACTO
> x1= 1 # Valor de conteo que se quiere calcular la probabilidad
> lamda=0.2 # En la distribución de Poisson lamda equivale a la media o a la
varianza, son el mismo valor
> dpois(x1,lamda) # La probabilidad de que en 100 semillas una tenga 1 picadura es
de 0.1637 o de 16.37 por ciento
[1] 0.1637462
>
> ## DOS PICADURAS O MAS TOCA A UNO QUITARLE LAS PROBABILIDADES DE
CERO MAS LA DE UNO
> x0=0 # El valor de conteo que se quiere calcular la probabilidad, en este caso
que ninguna semilla tenga picaduras
> x2=1
> lamda=0.2 #media o varianza como es igual
> dpois(x0,lamda) # La probabilidad de que ninguna semilla tenga picaduras es de
0.8187 o del 81.87 por ciento
[1] 0.8187308
> 1-(dpois(x0,lamda)+dpois(x2,lamda)) # 1 menos la SUMA de la probabilidad de
tener cero picaduras mas una picdura (x0+x2)
[1] 0.0175231
> # La probabilidad de que 2 de las 100 semillas tengan picaduras es de 0.0175 o del
1.8 por ciento
>
>
>
>
>

También podría gustarte