Fase 3 - Grupo 1

ESTADISTICA DESCRIPTIVA
UNIDAD 2: FASE 3 – DISTRIBUCIÓN Y PROBABILIDAD
LAURA MELISSA BACCA DOUSDEBES 1.119.894.286
DANNA NATHALY AVILA CASALLAS 1.007.702.259
JORGE LUIS ACERO RUEDA 1.070.959.147
WUYLMERT HELADIO SEGURA PINEDA 1.013.664.012
LUIS ALBERTO CACERES TORRES
UNIVERSIDAD ABIERTA Y A DISTANCIA UNAD
OCTUBRE 2020
FACATATIVA
Introducción
En el presente trabajo abordaremos temas de distribución y probabilidad en donde se
representaran resultados de manera gráfica de experimentos aleatorios de azar definiendo y
aplicando conceptos básico y de esta forma validar la posibilidad de la ocurrencia de los
posibles resultados que ya se tenían contemplados en el experimento, de igual manera se
realizaran análisis rápidos en base a las gráficas obtenidas desde el software "Programa R"
siguiendo las indicaciones propuestas por el tutor y fortaleciendo conocimientos que se han
venido aprendiendo durante el desarrollo del curso estadística descriptiva (para agrarias).
A. Que es el espacio muestral, con qué letra se denota.
El espacio muestral se conoce como el conjunto de todos los resultados posibles al realizar
un experimento aleatorio, algo particular es que se puede realizar los experimentos las veces
que sean necesarias bajo las mismas condiciones siempre sabiendo el conjunto de posibles
resultados.
Se denota con la letra E, S o Ω
B. Que es el punto muestral.
Los puntos muestrales se conocen como todos los posibles elementos que se encuentran en
el espacio muestral de un experimento aleatorio
C. Que es un evento muestral.
Es un subconjunto del espacio muestral, es decir uno o varios elementos dentro del
experimento aleatorio.
D. Que es una variable aleatoria
Una variable aleatoria es una función real medibles que asocia un valor numérico a cada
resultado del espacio muestral el cual está asociado a un experimento aleatorio, algo
interesante de la variable aleatoria es que permite aplicar análisis matemáticos a situaciones
con incertidumbre
E. ¿Qué significa que el espacio muestral de una variable aleatoria continua es no
contable?
Los espacios muestrales se han dividido en dos categorías que son: Espacio muestral
discreto y el Espacio muestral continuo.
En el Espacio muestral discreto hay un número determinado de opciones conocidas, por
ejemplo: 6 caras en un dado. No es posible obtener más de seis posibilidades. Están limitadas,
ya que estamos dentro de x número de opciones. En cambio, el Espacio muestral continuo es

cuando la variabilidad obtenida es continua y no podemos deducirla. Se desconoce la
variabilidad que vamos a tener, no suele ser muy exacta, porque depende del instrumento
utilizado y el juicio del espectador. Esto quiere decir que los datos que tengamos
generalmente estarán sujetos de error. [ CITATION Gar14 \l 3082 ]
F. ¿Qué son variables aleatorias discretas proporcionales y que son variables
aleatorias discretas de conteo no acotado? De ejemplos de este tipo de variables.
Las variables aleatorias discretas proporcionales son un numero finito o lo más numerable
de valores. Por ejemplo, el número exacto de una cantidad en una manada de caballos.
Las variables aleatorias discretas de conteo no acotado es cuando la variable solo es capaz
de poder adquirir un numero finito de valores dentro de un intervalo, lo que quiere decir que
es aleatoria discreta. Por ejemplo, el número de semillas germinadas en las cajas de Petri con
25 semillas cada caja. Los resultados se expresarían como proporciones porque existe un
denominador natural. [ CITATION Gar14 \l 3082 ]
G. Existen dos conceptos de probabilidad: el clásico y el concepto frecuencial; defina
cada uno.
La probabilidad clásica es el número de resultados favorables a la presentación de un
evento dividido entre el número total de resultados posibles. Se aplica cuando cada evento
simple del espacio muestral tiene la misma probabilidad de ocurrir.
La probabilidad frecuencial hace referencia a la probabilidad entendida como el cociente
entre el número de casos favorables y el número de casos posibles, cuando número de casos
tiende a infinito. [ CITATION Jos1 \l 3082 ]
H. En el caso de la probabilidad frecuencial, explique el experimento de germinación
de una semilla, cuál es el experimento aleatorio, cuál es el evento y cuantos puntos
muestrales tiene.
Entonces la probabilidad de que germine una semilla es de 50%

El evento es que A=germine la semilla o B=la semilla no germina
Y como resultado A=Obtienes una planta o B=No obtienes nada
El punto muestral es una semilla.[ CITATION Jos1 \l 3082 ][ CITATION Gar14 \l 3082 ]
I. ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de
probabilidad?
La frecuencia relativa se calcula con el cociente de la frecuencia absoluta de algún valor
de la población o la muestra, entre el total de valores que compone la población o la muestra.
La frecuencia de probabilidad hace referencia a la definición de probabilidad entendida
como el cociente entre el número de casos favorables y el número de casos posibles, cuando
el número de casos tiende a infinito.
J. ¿Qué son eventos mutuamente excluyentes? ¿Cómo es la intersección de dos
eventos mutualmente excluyentes? ¿Si son excluyentes, dado un evento A y uno B,
a que es igual la P (AUB)?
Los eventos mutualmente excluyentes se dan cuando dos o más eventos no pueden suceder
al mismo tiempo, y la suma de sus probabilidades individuales es la probabilidad de que el
evento ocurra.
La probabilidad de la unión de dos sucesos incompatibles será igual a la suma de las
probabilidades de cada uno de los sucesos (ya que su intersección es el conjunto vacío por lo
tanto no hay que restarle nada).
K. En el caso de distribuciones de variables aleatorias, si una variable es continua y
simétrica, ¿Qué modelo se usa?
Dada una variable aleatoria continua X, definida en el intervalo [a, b] de la recta real,
diremos que X tiene una distribución uniforme en el intervalo [a, b] cuando su función de
densidad sea X~U ([a, b]) f (x) = 1/(b-a) para x E [a, b]

Una variable aleatoria X o, equivalentemente, su distribución es simétrica alrededor de un
punto a Er
P (X ≤ α + x) = P (X ≥ α − x), ∀x ∈ R.
Para una variable de conteo no acotado ¿Qué modelo se utiliza?
Variables de interés: Y ∈ {0, 1, 2, . . .}, se debe analizar Y como función de variables
explicativa: E (Y |X1, X2, . . ., Xk)
M. Para una variable de conteo no acotado, ¿qué modelo se utiliza?
Para una variable de conteo no acotado el modelo usado es el modelo de distribución
binomial en el cual se determina la probabilidad de éxito constante Los resultados de cada
realización del experimento se clasifican en dos categorías probabilidad de éxito, y otra la de
fracaso.
N. Para variables de proporciones ¿qué modelo se utiliza?
Para la variable de proporciones el modelo que se utiliza es de distribución de pisson
debido a que este modelo se emplea para describir varios procesos, y asume valores enteros
fácilmente notables, esta distribución nos muestra la probabilidad de que ocurra un
determinado suceso en número de veces K en un intervalo determinado de tiempo, longitud,
área y demás.
O. ¿Qué variables tienen función de probabilidad y cuáles variables tienen función de
densidad?
VARIABLES CON FUNCION DE PROBABILIDAD
Distribución binomial
Distribución de poisson
VARIABLES CON FUNCION DE DENSIDAD
Distribución uniforme continua

Distribución normal tipificada o estandarizada
Distribución Chi-cuadrado de Pearson
Distribución t-Student
Distribución F-Snedecor
P. ¿Cuáles son los parámetros más usados en estadística para estudiar y utilizar
funciones de distribución de variables aleatorias?
PARAMETROS DE DISTRIBUCION DE VARIABLES ALEATORIAS
Media
Probabilística
Aritmética
Geométrica
Armónica
Cortada
Mediana
Moda
Q. ¿Qué es la esperanza matemática de una variable aleatoria? ¿cómo se denota?
La esperanza matemática, también llamada valor esperado, es igual al sumatorio de las
probabilidades de que exista un suceso aleatorio, multiplicado por el valor del suceso
aleatorio. Dicho de otra forma, es el valor medio de un conjunto de datos. Esto, teniendo en
cuenta que el término esperanza matemática está acuñado por la teoría de la probabilidad.
Mientras que, en matemáticas, se denomina media matemática al valor promedio de un
suceso que ha ocurrido. En distribuciones discretas con la misma probabilidad en cada
suceso, la media aritmética es igual que la esperanza matemática.

 Abra “Código Fase 3 - DADOS.txt”, ejecútelo y responda las siguientes
preguntas:
a) Explique en sus propias palabras el experimento aleatorio del dado.
El experimento aleatorio del dado nos dice que de dos dados pueden tener 36
posibles resultados ya que al combinar cada uno con los demás van arrojando
diferentes opciones así que al realizar varios lanzamientos no se sabrá cual será el
resultado, pero si se sabe el conjunto de todos los resultados posibles y la
probabilidad del mismo.
b) Adjunte en el informe los tres gráficos generados por el código
Frecuencias relativas acumuladas
PERIODO 764 - FRECUENCIAS RELATIVAS ACUMULADAS SUMA DE CARAS

1.0
0.8
Frecuencias relativas
0.6
0.4
0.2
0.0
2 3 4 5 6 7 8 9 10 11 12
En la gráfica que Frecuencia relativa acumulado se puede observar que la probabilidad al
sumar las dos caras es del 0.027 y este a su vez al ir realizando más experimentos aleatorios y
sumando las caras nos va arrojando la probabilidad que hay de obtener un mayor resultado
sin salirse del rango de resultados del experimento.
Frecuencias Absolutas
PERIODO 764 - Gráfico de barras SUMA DE CARAS

6
5
Frecuencias absolutas
4
3
2
1
0
2 3 4 5 6 7 8 9 10 11 12
En la gráfica de frecuencia absoluta de la suma de caras podemos observar la cantidad de
veces que se repite el número de pruebas aleatorias al arrojar los dados y así obteniendo el
mismo resultado en varias ocasiones.

PERIODO 764 - FRECUENCIAS RELATIVAS SUMA DE CARAS

0.20
0.15
0.10
0.05
0.00
2 3 4 5 6 7 8 9 10 11 12
En esta grafica podemos observar la frecuencia relativa de la suma de caras al realizar el
experimento aleatorio en donde los valores que se observan el eje x el resultado de la barra
que indica el numero 7 tiene mayor número de veces de arrojar el resultado según los valores
del eje y.
"Producción de leche - Función de Distribución N (misma varianza, distinta media)
ERIODO 764 - Producción de leche Función de Distribución N (misma varianza, distinta

0.12
0.10
0.08
F(x)
0.06
0.04
0.02
0.00
10 15 20 25 30 35 40
Producción de leche (litros/día)
En esta grafica nos indica como la frecuencia relativa para la producción de leche, se
representa con una frecuencia de 0.12 en el valor del eje x, por cada 25Lt (litros) de leche en
los valores del eje y.
"Producción de leche - Función de Distribución N (misma media, distinta varianza"

PERIODO 764 - Producción de leche Función de Distribución N (misma media, distinta varianza
0.4
0.3
F(x)
0.2
0.1
0.0
10 15 20 25 30 35 40
Producción de leche (litros/día)

A diferencia de la primera frecuencia, en el período 764 muestra que se producen 25 litros
en los valores del el eje y, en una frecuencia de 0,1 en los valores del eje x.
Rendimiento de maíz - Función de Distribución N(media.sigma)
PERIODO 764 - Rendimiento de maíz Distribución Normal con área bajo la curva
0.05
0.04
0.03
F(x)
0.02
0.01
0.00
20 40 60 80 100
Rendimiento (qq/Ha)
En esta grafica se puede apreciar la función de distribución del maíz se ve la dinámica y
los valores alcanzados en cada una de las variables de siembra, se obtuvo un crecimiento
acelerado dentro de la variable de 20 a 100 de rendimiento, se encuentra entre 50 a 80
unidades de rendimiento, teniendo un tope de frecuencia de 0.05.

"Distribución Binomial Germinación de semillas\n(n=10,p=0.25)"
PERIODO 764 - Distribución Binomial - Germinación de semillas

(n=10,p=0.25)
0.25
0.20
Probabilidad del evento
0.15
0.10
0.05
0.00
0 1 2 3 4 5 6 7 8 9 10
Evento (germinación de x semillas)
Encontramos en la gráfica de distribución binomial de germinación de semillas
(n..10,p..0.25) un modelo de probabilidad discreto en donde se evidencia la probabilidad de
que suceda la germinación y el evento que es la plantación de las semillas, encontrando en el
evento #2 el más alto nivel de frecuencia obteniendo una probabilidad después de 0.25
niveles de probabilidad .
14. Lea el Capítulo 3 – Modelos probabilísticos del libro Estadística y Biometría de
Mónica Balzarini y responda las siguientes preguntas:
a. Qué tipo de histograma se debe seleccionar en un modelo probabilístico para una
variable aleatoria continua cuando se tienen datos de esa variable.
Variable Discreta Un modelo probabilístico de un experimento requiere asociar un valor
de probabilidad a cada punto del espacio muestral. En el caso de las variables aleatorias
discretas, la función que asocia una probabilidad a la variable se denomina función de
probabilidad de masa (fpm), y se designa por px(x0 ) . Esta función representa la
probabilidad que la variable aleatoria X tome el valor x0 en la realización del experimento.
Usualmente, la función de probabilidad de masa se representa por un gráfico de barras para
cada valor de la variable aleatoria.
El concepto de función probabilidad de masa puede extenderse al caso de varias variables.
En especial, para dos variables, se define la función de probabilidad de masa compuesta,
como la probabilidad que los valores experimentales de la variable aleatoria X e Y, al realizar
un experimento sean iguales a x0 e y0 respectivamente y se designa por pXY (x0 , y0 ).
Análogamente al caso anterior, esta función tiene las siguientes propiedades:
Variable Continua La probabilidad asociada a una variable continua, está representada por
la función densidad de probabilidades (fdp). Si X es una variable aleatoria continua en el
rango -∞ a + ∞ se define:
Siendo fx (x) = la función densidad de probabilidades.

b. Qué es la estandarización, cuál es su fórmula.
La estandarización es el proceso de ajustar o adaptar características en un producto, servicio o
procedimiento; con el objetivo de que éstos se asemejen a un tipo, modelo o norma en
común.
Hay un procedimiento que funciona como una especia de bala de plata para todos estos casos:
estandarizar. Lo que hacemos es transformar la variable original, restándole a cada valor la
media y dividiendo esto entre la desviación típica. Formalmente, dada una muestra
x1,x2,...,xn, calculamos:
xi−X
Zi =
Sx
Usualmente en la literatura nos dirán que esta nueva variable Z no tiene unidades, y esto es
cierto. Sin embargo, una manera de interpretar los valores zi es pensar que está expresada en
desviaciones típicas. Efectivamente, si z1=1, esto significa que xi está una desviación típica
por encima de la media. Por ejemplo, si xi=20, la media X¯=15 y la desviación típica
Sx=5SX=5, zi = (20−15) / 5=1, y como podemos ver, xi está una desviación típica por
encima de la media.
c. Qué tipo de conteos se trabajan con la distribución Binomial.
Una distribución binomial es una distribución de probabilidad discreta en donde se
descubre el numero e éxito al realizar n experimentos independientes entre sí, acerca de
una variable aleatoria.
d. En la distribución binomial qué es n y qué es P.
n = Número de ensayos/experimentos
x = Número de éxitos
p = Probabilidad de éxito
q = Probabilidad de fracaso (1-p
e. A qué es igual la esperanza y la varianza en la distribución binomial.
Media
En una distribución binomial, la media nos indica el valor medio de un fenómeno aleatorio.
Se calcula con la siguiente fórmula:
Donde:
n es el número de ensayos
p es la probabilidad de éxito
Varianza
Es una medida de dispersión que nos indica qué tan lejos se encuentran los cuadrados de la
desviación de la media. Se calcula con la fórmula
Donde:
n es el número de ensayos
p es la probabilidad de éxito
q es la probabilidad de fracaso
f. Mencione ejemplos en su área de estudio donde se podría utilizar la distribución
Binomial.
Muestra Generalmente es imposible o impracticable examinar alguna característica en la
población entera, por lo que se examina una parte de ella y en base a la información relevada
en esa porción se hacen inferencias sobre toda la población.
Variables
Las observaciones o mediciones sobre los elementos de una población constituyen la
materia prima con la cual se trabaja en Estadística. Para que dichas observaciones puedan ser
tratadas estadísticamente deben estar expresadas o poder ser reexpresadas en términos
numéricos. Aunque sea obvio, se destaca que la característica de interés a observar o medir
en cada elemento de la población debe ser la misma, en tanto que se espera que no asuma el
mismo valor en cada uno de los elementos que la conforman. Aquellas características que van
cambiando en su estado o expresión entre los elementos de la población se denominan
"variables", mientras que aquellas que no cumplen esta condición son llamadas "constantes".
A modo ilustrativo se presentan algunos ejemplos de notación con subíndices:
a) xi, i=1,...,6 hace referencia taxativamente a los valores observados x1, x2, x3, x4, x5, y
x6, no interesando otros si existieran.
b) xi, i=1,... en este caso i puede valer a partir de 1 en adelante y hasta infinito.
c) xi, i=0,1,... en este caso i puede valer desde cero hasta infinito.
Tipos de variables
Se llamará variable continua a aquella característica cuyas observaciones pueden asumir
cualquier valor dentro de un intervalo. En estos casos el conjunto de posibles valores es no
numerable1. En otras palabras, existe una cantidad infinita de posibles valores para los
resultados de la variable. Se puede describir el conjunto de posibles valores de una variable
continua de distintas formas. Se suele seguir la siguiente convención:
a) Un intervalo es cerrado si sus extremos pertenecen al mismo, lo que se denotará con
corchetes, por ejemplo, [a, b] denota al conjunto de todos los x tal que a ≤ x ≤ b.
b) Un intervalo es abierto si sus extremos no pertenecen al mismo, lo que se denotará con
paréntesis, por ejemplo, (a, b) denota al conjunto de todos los x tal que a < x < b.
c) Un intervalo es semi-cerrado (o semi-abierto) si uno de sus extremos no pertenece al
mismo, lo que se denotará con el corchete y el paréntesis que corresponda. Por ejemplo, (a, b]
denota al conjunto de todos los x tal que a< b}.
g. Qué tipos de conteos se trabajan con la distribución de Poisson.
Función de cuantía
A partir de las hipótesis del proceso, se obtiene una ecuación diferencial de definición del mismo que
puede integrarse con facilidad para obtener la función de cuantía de la variable "número de hechos
que ocurren en un intervalo unitario de tiempo o espacio
Que sería :
La función de distribución vendrá dada por :
Función Generatriz de Momentos
Su expresión será :

dado que tendremos que
luego :
Para la obtención de la media y la varianza aplicaríamos la F.G.M.; derivándola sucesivamente e

igualando t a cero .
Así.

Una vez obtenida la media, obtendríamos la varianza en base a :

haciendo t = 0

por lo que =
así se observa que media y varianza coinciden con el parámetro del modelo
siendo, l
En cuanto a la moda del modelo tendremos que será el valor de la variable que tenga mayor
probabilidad , por tanto si Mo es el valor modal se cumplirá que :
Y, en particular:
A partir de estas dos desigualdades, es muy sencillo probar que la moda tiene que
verificar: De manera que la moda será la parte entera del parámetro l o dicho de
otra forma, la parte entera de la media
Podemos observar cómo el intervalo al que debe pertenecer la moda tiene una amplitud de una
unidad, de manera que la única posibilidad de que una distribución tenga dos modas será que los
extremos de este intervalo sean números naturales, o lo que es lo mismo que el parámetro l sea
entero, en cuyo caso las dos modas serán l -1 y l.
Teorema de adición.
La distribución de Poisson verifica el teorema de adición para el parámetro l.
"La variable suma de dos o más variables independientes que tengan una distribución de Poisson de
distintos parámetros l (de distintas medias) se distribuirá, también con una distribución de Poisson
con parámetro l la suma de los parámetros l (con media, la suma de las medias):
En efecto:
Sean x e y dos variables aleatorias que se distribuyen con dos distribuciones de Poisson de distintos
parámetros siendo además x e independientes
Así e
Debemos probar que la variable Z= x+y seguirá una Poisson con parámetro igual a la suma de los
de ambas:
En base a las F.G.M para X
Para Y
De manera que la función generatriz de momentos de Z será el producto de ambas ya que son
independientes :
Siendo la F.G.M de una Poisson
Convergencia de la distribución binomial a la Poisson
Se puede probar que la distribución binomial tiende a converger a la distribución de Poisson
cuando el parámetro n tiende a infinito y el parámetro p tiende a ser cero, de manera que el
producto de n por p sea una cantidad constante. De ocurrir esto la distribución binomial tiende a un
modelo de Poisson de parámetro l igual a n por p
Este resultado es importante a la hora del cálculo de probabilidades , o , incluso a la hora de inferir
características de la distribución binomial cuando el número de pruebas sea muy grande y
la probabilidad de éxito sea muy pequeña .
El resultado se prueba , comprobando como la función de cuantía de una distribución binomial
con y tiende a una función de cuantía de una distribución de Poisson

con siempre que este producto sea una cantidad constante ( un valor finito)
En efecto : la función de cuantía de la binomial es

Y llamamos tendremos que:

realizando que es la función de cuantía de una distribución de

Poisson
Estimación Bayesiana sobre muestras de poisson.
Análogamente a como planteábamos el problema de necesitar estimar la proporción de una

característica, en el caso de un modelo binomial, en alguna situación práctica, podemos estar
interesados en determinar el parámetro desconocido de una distribución de Poisson. Por ejemplo,
podríamos estar interesados en determinar el número medio de clientes que acuden a una
ventanilla de una oficina pública.
El planteamiento de la estimación podría hacerse utilizando información suministrada por una
experiencia {las observaciones de cuántos hechos se producen en un intervalo experimental),
conjuntamente con algún otro tipo de información a priori. En este caso, estaríamos, como ya
comentábamos en el caso binomial ante un planteamiento bayesiano del problema.
La solución requerirá que dispongamos de una información inicial que puede especificarse a través
de una distribución a priori de probabilidad. De manera que la función de cuantía de esta
distribución a priori (o su f. de densidad si fuera continua) nos asigne probabilidades a cada posible
valor del parámetro l.
Utilizando únicamente la información inicial la estimación sería la media de la distribución a priori.
Pero realizando una experiencia podremos mejorar la información acerca de l Si observamos la
realización de hechos durante un intervalo experimental y se producen x hechos, para cada posible
valor de l podremos calcular su verosimilitud definida como la probabilidad de que se dé ese
resultado si el valor de l es el considerado:
Obviamente esta probabilidad condicionada será la función de cuantía de una distribución de

Poisson con . para el valor de la variable x.
Finalmente podemos calcular las probabilidades de cada valor alternativo de, condicionada al
resultado de la experiencia aplicando el teorema de bayes:
Estas probabilidades finales (a posteriori) constituirán la función de cuantía de la distribución a

posteriori que nos dará cuenta de toda la información disponible (tanto muestral como no
muestral) .
La estimación mejorada del parámetro será, entonces, la media de la distribución a posteriori.
Planteamos un ejemplo:
Tres ejecutivos del Insalud opinan que el número medio de pacientes que llegan a cierto servicio
nocturno de guardia durante una hora es 2, según el primero, 3, según el segundo, y 5 según el
tercero.
Sus opiniones pueden ponderarse teniendo en cuenta que el primero tiene el doble de
experiencia profesional que los otros dos.
Para tomar una decisión de asignación de personal en ese servicio quieren estimar el número
medio de pacientes, sin despreciar sus opiniones, por lo que realiza una experiencia controlando una
hora de actividad en el servicio en la que acuden 3 pacientes. Esta información la van a combinar con
la inicial a través de un proceso Bayesiano.
h. Cómo se denota el único parámetro de la distribución de Poisson.
La función de masa de probabilidad de la distribución de Poisson es
donde
 k es el número de ocurrencias del evento o fenómeno (la función nos da la

probabilidad de que el evento suceda precisamente k veces).
 λ es un parámetro positivo que representa el número de veces que se espera que
ocurra el fenómeno durante un intervalo dado. Por ejemplo, si el suceso estudiado tiene
lugar en promedio 4 veces por minuto y estamos interesados en la probabilidad de que
ocurra k veces dentro de un intervalo de 10 minutos, usaremos un modelo de distribución
de Poisson con λ = 10×4 = 40.
 e es la base de los logaritmos naturales (e = 2,71828…)
La divergencia Kullback-Leibler desde una variable aleatoria de Poisson de parámetro λ0 a
otra de parámetro λ es
i. ¿A qué es igual la media y la varianza en la distribución de Poisson?
Media y varianza de la distribución de Poisson
X ∼ P(λ) ⇒ E[X] = Var[X] = λ
Calculo directo
Calculo directo En primer lugar, obtenemos la expresión de E[X].
Calculo directo En primer lugar, obtenemos la expresión de E[X]
donde la ´ultima igualdad se obtiene teniendo en cuenta que e −λ λ y y! , y = 0, 1, . . . ,
es la función masa de probabilidad de una variable P(λ), por lo que la suma de esos
valores es la unidad.
j. Mencione ejemplos en su área de estudio donde se podría utilizar la distribución de
Poisson.
Variables
Las observaciones o mediciones sobre los elementos de una población constituyen la
materia prima con la cual se trabaja en Estadística. Para que dichas observaciones puedan ser
tratadas estadísticamente deben estar expresadas o poder ser reexpresadas en términos
numéricos. Aunque sea obvio, se destaca que la característica de interés a observar o medir
en cada elemento de la población debe ser la misma, en tanto que se espera que no asuma el
mismo valor en cada uno de los elementos que la conforman. Aquellas características que van
cambiando en su estado o expresión entre los elementos de la población se denominan
"variables", mientras que aquellas que no cumplen esta condición son llamadas "constantes".
A modo ilustrativo se presentan algunos ejemplos de notación con subíndices:
a) xi, i=1,...,6 hace referencia taxativamente a los valores observados x1, x2, x3, x4, x5, y
x6, no interesando otros si existieran.
b) xi, i=1,... en este caso i puede valer a partir de 1 en adelante y hasta infinito.
c) xi, i=0,1,... en este caso i puede valer desde cero hasta infinito.
Tipos de variables
Se llamará variable continua a aquella característica cuyas observaciones pueden asumir
cualquier valor dentro de un intervalo. En estos casos el conjunto de posibles valores es no
numerable1. En otras palabras, existe una cantidad infinita de posibles valores para los
resultados de la variable. Se puede describir el conjunto de posibles valores de una variable
continua de distintas formas. Se suele seguir la siguiente convención:
a) Un intervalo es cerrado si sus extremos pertenecen al mismo, lo que se denotará con
corchetes, por ejemplo, [a, b] denota al conjunto de todos los x tal que a ≤ x ≤ b.
b) Un intervalo es abierto si sus extremos no pertenecen al mismo, lo que se denotará con
paréntesis, por ejemplo, (a, b) denota al conjunto de todos los x tal que a < x < b.
c) Un intervalo es semi-cerrado (o semi-abierto) si uno de sus extremos no pertenece al
mismo, lo que se denotará con el corchete y el paréntesis que corresponda. Por ejemplo, (a, b]
denota al conjunto de todos los x tal que a< b}.

Conclusiones
En este trabajo se analizaron e identificaron los diferentes conceptos básicos en cuanto a
probabilidad y distribuciones de probabilidad, que suelen ser las más usadas en el campo de
las ciencias agrarias. Presentamos resultados de manera gráfica frente a experimentos
aleatorios, aplicando los conceptos básicos ya explicados y así mismo poder validar la
posibilidad de los resultados que se tienen contemplados en el experimento. Se realizaron
análisis breves en cuanto a las gráficas que se obtuvieron desde el software “Programa R”
siguiendo las indicaciones regidas por el tutor, también fortaleciendo los conocimientos que
se han ido conociendo y aprendiendo durante este curso de Estadística Descriptiva (para
agrarias).
Bibliografía
García, P. A. (2014). Obtenido de https://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/48802
JoséFranciscoLópez. (s.f.). Economipedia . Obtenido de
https://economipedia.com/definiciones/probabilidad-frecuencial.html
Balzarini, M. (15 de Marzo de 2012). Estadística y Biometría. Obtenido de
http://www.agro.unc.edu.ar/~mcia/archivos/Estadistica%20y%20Biometria.pdf
Di Rienzo, J. A. (20 de Marzo de 2005). Estadística para las Ciencias Agropecuarias.
Obtenido de
https://aulavirtual.agro.unlp.edu.ar/pluginfile.php/2968/mod_resource/content/0/Estad
istica_para_las_Ciencias_Agropecuarias_-_Di_Rienzo.pdf
Resultados obtenidos en el programa R
Código DADO
R version 4.0.3 (2020-10-10) -- "Bunny-Wunnies Freak Out"
Copyright (C) 2020 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)
R es un software libre y viene sin GARANTIA ALGUNA.
Usted puede redistribuirlo bajo ciertas circunstancias.
Escriba 'license()' o 'licence()' para detalles de distribucion.
R es un proyecto colaborativo con muchos contribuyentes.
Escriba 'contributors()' para obtener más información y
'citation()' para saber cómo citar R o paquetes de R en publicaciones.
Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,
o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.
Escriba 'q()' para salir de R.
> # EXPERIMENTO ALEATORIO LANZAR DOS DADOS - PERIODO 764
>
> # Hay 36 posibles resultados, que da de combinar cada número con los demás
> # Iniciamos con el número 1 en el primer dado y lo vamos combinando con las seis
posibles opciones del segundo dado (1,2,3,4,5,6)
> # Hacemos lo mismo con el número 2 del primer dado y las seis combinaciones que
puede haber con el segundo y así sucesivamente,
> # hasta obtener una matriz de ESPACIO MUESTRAL como se presenta a continuación:
> #(1,1), (1,2), (1,3), (1,4), (1,5), (1,6),
> #(2,1), (2,2), (2,3), (2,4), (2,5), (2,6),
> #(3,1), (3,2), (3,3), (3,4), (3,5), (3,6),
> #(4,1), (4,2), (4,3), (4,4), (4,5), (4,6),
> #(5,1), (5,2), (5,3), (5,4), (5,5), (5,6),
> #(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}
>
> # VEMOS QUE HAY 36 RESULTADOS POSIBLES, POR TANTO ESTE ES EL
ESPACIO MUESTRAL
> # La probabilidad siempre tendrá denominador 36 (x/36)
> # PUNTOS MUESTRALES = 36
> # Los eventos son subconjuntos del espacio muestral (los 36 posibles resultados del
dado)
> # Por ejemplo, un evento puede ser que en ambos dados salgan números pares (2,2 4,4
6,6)
> # Otro evento puede ser sacar dos números iguales, en donde se tendrían los siguientes
posibles resultados:
> # POSIBLE RESULTADOS: (1,1),(2,2),(3,3),(4,4),(5,5),(6,6)
> # En este caso habrían 6 resultados de éxito de los 36 posibles del espacio muestral.
> # La probabilidad por tanto de obtener dos números iguales sería: 6/36 = 0.166 O 16,6%
en términos porcentuales
>
> # VARIABLE ALEATORIA Y = SUMA DE VALORES
> # Es otra forma de presentar los 36 posibles eventos del espacio muestral, en donde se
suman los valores obtenidos en cada dado:
>
> #(2), (3), (4), (5), (6), (7),
> #(3), (4), (5), (6), (7), (8),
> #(4), (5), (6), (7), (8), (9),
> #(5), (6), (7), (8), (9), (10),
> #(6), (7), (8), (9), (10), (11),
> #(7), (8), (9), (10), (11), (12)
>
> # De esta forma se puede procesar su análisis en el programa R
>
> PROCESAMIENTO EN R
Error: unexpected symbol in " PROCESAMIENTO EN"
>
> # Creamos el vector con los datos sumando los valores de cada dado, como se indicó
anteriormente
> # EJEMPLO:
> # (1,1),(1,2),(1,3),(1,4),(1,5),(1,6)
> # Sumando quedará: 2, 3, 4, 5, 6, 7 y así sucesivamente hasta llegar al último evento
(6,6):
>
> SUMADADOS=c(2, 3, 4, 5, 6, 7,
+ 3, 4, 5, 6, 7, 8,
+ 4, 5, 6, 7, 8, 9,
+ 5, 6, 7, 8, 9, 10,
+ 6, 7, 8, 9, 10, 11,
+ 7, 8, 9, 10, 11, 12)
>
> # TABLAS DE FRECUENCIAS PARA LA VARIABLE DISCRETA
"SUMADADOS":
>
> # En este caso las tabla de frecuencias se desarrollan por pasos:
>
> table(SUMADADOS) # Tabla de frecuencias absolutas
SUMADADOS
2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
> fabs=table(SUMADADOS) # Asignación al comando de Tabla de frecuencias
absolutas el nombre: "fabs"
> fabs
SUMADADOS
2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
> fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas
> fabsacum
2 3 4 5 6 7 8 9 10 11 12
1 3 6 10 15 21 26 30 33 35 36
> frel=prop.table(table(SUMADADOS)) # Asignación al comando de Tabla de
frecuencias relativas el nombre: "frel"
> frel # Tabla de frecuencias relativas
SUMADADOS
2 3 4 5 6 7 8
0.02777778 0.05555556 0.08333333 0.11111111 0.13888889 0.16666667 0.13888889
9 10 11 12
0.11111111 0.08333333 0.05555556 0.02777778
> # Podemos decir entonces que la probabilidad que la suma de las dos caras sea igual a 2
es del 0.027 o 2.7% en términos porcentuales.
> # Las probabilidades se multiplican por 100 para expresarlas en porcentaje.
>
> frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
> frelacum
2 3 4 5 6 7 8
0.02777778 0.08333333 0.16666667 0.27777778 0.41666667 0.58333333 0.72222222
9 10 11 12
0.83333333 0.91666667 0.97222222 1.00000000
> # En este caso, la probabilidad de obtener un valor mayor o igual a 2 pero menor de 4 es
de 0.083 o 8.3%
> # es lo mismo que sumar la probabilidad de obtener un valor de 2 (0.027) y de 3 (0.055)
= 0.083
>
> # GRAFICOS DE FRECUENCIAS:
>
> barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 764 - Gráfico de barras
SUMA DE CARAS") # Gráfico de Frecuencias absolutas
>
Codigo Modelos
R version 4.0.3 (2020-10-10) -- "Bunny-Wunnies Freak Out"
Copyright (C) 2020 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)
R es un software libre y viene sin GARANTIA ALGUNA.
Usted puede redistribuirlo bajo ciertas circunstancias.
Escriba 'license()' o 'licence()' para detalles de distribucion.
R es un proyecto colaborativo con muchos contribuyentes.
Escriba 'contributors()' para obtener más información y
'citation()' para saber cómo citar R o paquetes de R en publicaciones.
Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,
o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.
Escriba 'q()' para salir de R.
> # MODELOS DE DISTRIBUCIONES - PERIODO 764
>
> # DISTRIBUCION NORMAL
> # EJERCIO DE LAS VACAS DEL TAMBO, Libro Estadística y Biometría de Mónica
Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución normal, página
91
> # La producción de leche diaria de las vacas de un tambo se distribuye como el modelo
normal, con esperanza 25 litros (que es la misma media) y varianza de 9 litros al cuadrado:
> MEDIA=25
> VARIANZA=9
> # A las vacas se les da una nueva ración que aumenta su producción en 5 litros, pero no
cambia la varianza, ya que son los mismos animales:
> MEDIA2=30
> SIGMA=sqrt(VARIANZA)
> x=seq(15,40,by=0.5) #secuencia de valores en un un rango de producción de leche de
15 a 40 litros
> dnorm(x,MEDIA,SIGMA)
[1] 5.140930e-04 8.836587e-04 1.477283e-03 2.402033e-03 3.798662e-03
[6] 5.842767e-03 8.740630e-03 1.271754e-02 1.799699e-02 2.477039e-02
[11] 3.315905e-02 4.317253e-02 5.467002e-02 6.733290e-02 8.065691e-02
[16] 9.397063e-02 1.064827e-01 1.173551e-01 1.257944e-01 1.311466e-01
[21] 1.329808e-01 1.311466e-01 1.257944e-01 1.173551e-01 1.064827e-01
[26] 9.397063e-02 8.065691e-02 6.733290e-02 5.467002e-02 4.317253e-02
[31] 3.315905e-02 2.477039e-02 1.799699e-02 1.271754e-02 8.740630e-03
[36] 5.842767e-03 3.798662e-03 2.402033e-03 1.477283e-03 8.836587e-04
[41] 5.140930e-04 2.908942e-04 1.600902e-04 8.569012e-05 4.461008e-05
[46] 2.258767e-05 1.112362e-05 5.327914e-06 2.482015e-06 1.124574e-06

[51] 4.955732e-07
>
> # Gráfico de distribución normal con media = 25 y varianza = 9
> # POR FAVOR NO LO CIERRE, ya que sobre este mismo aparecerá el siguiente
gráfico (continúe ejecutando el código)
> # Cuando aparezca el gráfico, seleccione nuevamente el código de ejecución (Editor R)
ubicando el cursor en el MARCO AZUL, donde aparece el nombre del código
> # De esta forma, mantendrá el orden de ejecución dentro del código:
>
> curve(dnorm(x,MEDIA,SIGMA),xlim=c(10,40),col="blue",lwd=2,
+ xlab="Producción de leche (litros/día)",ylab="F(x)",main="PERIODO 764 -
Producción de leche Función de Distribución N (misma varianza, distinta media")
> # se puede observar que cambia la ubicación de la media (esperanza), pero la forma de
ambas gráficas es la misma porque no cambió la varianza
>
> # Ahora se realiza el mismo procedimiento pero en este caso no cambia la media
(esperanza) sino las varianzas:
>
> MEDIA=25
> VARIANZA=9
> VARIANZA1=2
> SIGMA=sqrt(VARIANZA)
> SIGMA1=sqrt(VARIANZA1)
> x=seq(15,40,by=0.5)
> dnorm(x,MEDIA,SIGMA)
[1] 5.140930e-04 8.836587e-04 1.477283e-03 2.402033e-03 3.798662e-03
[6] 5.842767e-03 8.740630e-03 1.271754e-02 1.799699e-02 2.477039e-02
[11] 3.315905e-02 4.317253e-02 5.467002e-02 6.733290e-02 8.065691e-02
[16] 9.397063e-02 1.064827e-01 1.173551e-01 1.257944e-01 1.311466e-01
[21] 1.329808e-01 1.311466e-01 1.257944e-01 1.173551e-01 1.064827e-01
[26] 9.397063e-02 8.065691e-02 6.733290e-02 5.467002e-02 4.317253e-02
[31] 3.315905e-02 2.477039e-02 1.799699e-02 1.271754e-02 8.740630e-03
[36] 5.842767e-03 3.798662e-03 2.402033e-03 1.477283e-03 8.836587e-04
[41] 5.140930e-04 2.908942e-04 1.600902e-04 8.569012e-05 4.461008e-05
[46] 2.258767e-05 1.112362e-05 5.327914e-06 2.482015e-06 1.124574e-06
[51] 4.955732e-07
>
> # POR FAVOR NO LO CIERRE, ya que sobre este mismo aparecerá el siguiente
gráfico (continúe ejecutando el código)
>
> curve(dnorm(x,MEDIA,SIGMA),xlim=c(10,40),ylim=c(0,0.4),col="blue",lwd=2,
+ xlab="Producción de leche (litros/día)",ylab="F(x)",main="PERIODO 764 -
Producción de leche Función de Distribución N (misma media, distinta varianza")
>
> # Este gráfico (de color rojo) le debe aparecer junto con el anterior gráfico de color azul,
en la misma gráfica:
>
> curve(dnorm(x,MEDIA,SIGMA1),xlim=c(10,40), add=TRUE, col="red", lwd=2)

>
> # En este caso ambas gráficas tienen la misma media (o esperanza) pero sus formas
cambiaron porque tienen distinta varianza
> # A mayor varianza, la gráfica tendrá mayor amplitud
>
> # EJERCICIO DE HIBRIDO MAIZ, Libro Estadística y Biometría de Mónica Balzarini,
CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución normal, página 93
>
> # Si Y es el rendimiento de un híbrido de maíz que puede modelarse con una
distribución normal, con media de 60 qq/Ha y varianza de 49 qq/Ha:
> media= 60
> varianza= 49
> sigma=sqrt(varianza)
> sigma
[1] 7
> X=seq(35,85,by=0.5) # Secuencia de valores en un un rango de 35 a 85 qq/Ha
> dnorm(X,media,sigma)
[1] 9.684491e-05 1.246690e-04 1.596703e-04 2.034576e-04 2.579337e-04
[6] 3.253318e-04 4.082527e-04 5.097014e-04 6.331212e-04 7.824238e-04
[11] 9.620142e-04 1.176807e-03 1.432231e-03 1.734223e-03 2.089206e-03
[16] 2.504043e-03 2.985977e-03 3.542545e-03 4.181465e-03 4.910501e-03
[21] 5.737297e-03 6.669190e-03 7.712995e-03 8.874773e-03 1.015958e-02
[26] 1.157120e-02 1.311188e-02 1.478210e-02 1.658026e-02 1.850251e-02
[31] 2.054255e-02 2.269145e-02 2.493758e-02 2.726658e-02 2.966137e-02
[36] 3.210228e-02 3.456725e-02 3.703206e-02 3.947074e-02 4.185592e-02

[41] 4.415934e-02 4.635244e-02 4.840685e-02 5.029505e-02 5.199096e-02
[46] 5.347055e-02 5.471239e-02 5.569818e-02 5.641316e-02 5.684655e-02
[51] 5.699175e-02 5.684655e-02 5.641316e-02 5.569818e-02 5.471239e-02
[56] 5.347055e-02 5.199096e-02 5.029505e-02 4.840685e-02 4.635244e-02
[61] 4.415934e-02 4.185592e-02 3.947074e-02 3.703206e-02 3.456725e-02
[66] 3.210228e-02 2.966137e-02 2.726658e-02 2.493758e-02 2.269145e-02
[71] 2.054255e-02 1.850251e-02 1.658026e-02 1.478210e-02 1.311188e-02
[76] 1.157120e-02 1.015958e-02 8.874773e-03 7.712995e-03 6.669190e-03
[81] 5.737297e-03 4.910501e-03 4.181465e-03 3.542545e-03 2.985977e-03
[86] 2.504043e-03 2.089206e-03 1.734223e-03 1.432231e-03 1.176807e-03
[91] 9.620142e-04 7.824238e-04 6.331212e-04 5.097014e-04 4.082527e-04
[96] 3.253318e-04 2.579337e-04 2.034576e-04 1.596703e-04 1.246690e-04
[101] 9.684491e-05
>
>
> curve(dnorm(x,media,sigma),xlim=c(20,100),col="blue",lwd=2,
+ xlab="Rendimiento (qq/Ha)",ylab="F(x)",main="PERIODO 764 - Rendimiento de
maíz - Función de Distribución N(media.sigma)")
>
> # Especificamos el valor del que queremos saber su probabilidad, en este caso, 50:
> valor=50
> pnorm(valor,media,sigma)
[1] 0.07656373
>
> # Quiere decir que la probabilidad de que el rendimiento esté por debajo de 50 qq/Ha es
de 0.0765 o del 7.65 por ciento
>
> #PROBABILIDAD DE UN VALOR MAYOR
> valor=50
> # Para hallar la probabilidad de un valor mayor que 50, se resta 1 menos la probabilidad
de hallar un valor igual o menor:
>
> 1-pnorm(valor,media,sigma)
[1] 0.9234363
> # En este caso, la probabilidad de que el rendimiento esté por encima de 50 qq/Ha, es de
0.923 o 92.3 por ciento.
>
> # PROBABILIDAD EN UN RANGO DE VALORES
>
> # Probabilidad que un dato de rendimiento tomado al azar esté comprendido en el
intervalo de 50 a 65 qq/Ha:
> # Reemplaze por el rango de valores, valor 2 es el mayor y valor 1 es el menor:
> valor1=50
> valor2=65
> VALOR1=pnorm(valor1,media,sigma)
> VALOR1
[1] 0.07656373
> VALOR2=pnorm(valor2,media,sigma)
> VALOR2
[1] 0.7624747
>
> # PROBABILIDAD que el rendimiento se encuentre en el intervalo de 50 a 65 qq/Ha:
> VALOR2-VALOR1
[1] 0.685911
>
> # Se resta la probabilidad de que el rendimiento esté por debajo de 65 qq/Ha (p=0.762),
menos la probabilidad de que esté por debajo de 50 qq/Ha (0.0765)
>
> regionX=seq(valor1,valor2,0.01) # Intervalo a sombrear
>
> # GRAFICA DE ÁREA BAJO LA CURVA ENTRE 50 Y 65 qq/Ha
>
> xP <- c(valor1,regionX,valor2) # Base de los polígonos que crean el efecto
"sombra"
> yP <- c(0,dnorm(regionX,media,sigma),0) # Altura de los polígonos sombreados
>
> # Cuando le abra la gráfica no la cierre y vuelva al Editor R, seleccionando el marco
azul del cuadro, donde aparece el nombre del código
> curve(dnorm(x,media,sigma),xlim=c(20,100),col="blue",lwd=2,
+ xlab="Rendimiento (qq/Ha)",ylab="F(x)",main="PERIODO 764 - Rendimiento de
maíz Distribución Normal con área bajo la curva")
> polygon(xP,yP,col="orange1") # Área bajo la curva entre 50 y 65 qq/Ha
> box() # Crea un marco rodeando el área bajo la curva
>
> # DISTRIBUCION BINOMIAL
> # Ejercicio de la semilla de Panicum, Libro Estadística y Biometría de Mónica Balzarini,
CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución binomial, página 101:
> # Debe presentar estos resultados en su informe:
>
> # Supóngase que se toman 10 semillas de Panicum sp y se registra el evento
"Germinó"o "No germinó",después de 5 días desde su implantación:
> k= 7 # Queremos saber la probabilidad que germinen 7 de las 10 semillas
> n= 10 # Número total de ensayos realizados, en este caso son 10, que fueron el número
de semillas evaluadas
> p= 0.25 # La probabilidad de germinación de las semillas fue del 25 por ciento
>
> dbinom(k,n,p) # PROBABILIDAD DE UN VALOR IGUAL P(X=7), "que germinen
siete semillas"
[1] 0.003089905
>
> # Probabilidad que germinen al menos 3 de las 10 semillas:
> # En este caso, se interpreta como la probabilidad de que germinen tres o más semillas
> # Es equivalente a la probabilidad que germinen 3 semillas, más la probabilidad que
germinen 4, más la prob. que germinen 5; y así sucesivamente hasta 10.
> # Otra forma de calcularlo es a la inversa, calculando la probabilidad que germinen
menos de 3 y restándole a la probabilidad total:
>
> k1=2 # Hay que calcular la probabilidad de un valor que sea una unidad menor que
el que queremos hallar

>
> pbinom(k1,n,p) # esta es la probabilidad de que germinen menos de 3 semillas
[1] 0.5255928
>
> #Para conocer la probabilidad que germinen 3 o más semillas se resta 1 menos el
anterior resultado:
> 1-pbinom(k1,n,p) # La probabilidad de que germinen 3 o más semillas es de 0.4744 o
del 47.44 por ciento
[1] 0.4744072
>
> # Probabilidad de que germinen a lo sumo 5 semillas:
> # A lo sumo se interpreta que germinen máximo 5 semillas
> k2=5
> pbinom(k2,n,p) # La probabilidad de que germinen a lo sumo 5 semillas, es de 0.98 o
del 98 por ciento
[1] 0.9802723
>
> # La esperanza de esta variable aleatoria:
> E=n*p
>E
[1] 2.5
> # La esperanza es de 2.5
>
> # La varianza de esta variable aleatoria
> V=n*p*(1-p)
>V
[1] 1.875
> # La varianza es de 1.875
>
> # Gráfico de distribución Binomial para el ejercicio de germinación de semillas:
>
> x <- 0:n
> prob <- dbinom(x,n,p)
> barplot(prob,col = "red",names.arg=x,
+ xlab="Evento (germinación de x semillas)",ylab="Probabilidad del
evento",main="PERIODO 764 - Distribución Binomial - Germinación de
semillas\n(n=10,p=0.25)")
> #este gráfico muestra la probabilidad de ocurrencia de cada uno de los 11 eventos
posibles, es decir que germinen 0 semillas, 1.., hasta 10.
> # En este caso, cuando p es menor que 0.5, la distribución se encuentra sesgada
positivamente hacia la izquierda
>
> # DISTRIBUCION DE POISSON
>
> # La distribución de Poisson se usa para distribuciones de variables discretas (conteos)
>
> # EJERCICIO DE LAS PICADURAS DE GORGOJO, Libro Estadística y Biometría de
Mónica Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución Poisson,
página 105:
> # Supongamos que el número promedio de picaduras de gorgojo por semilla es 0.2 (es
decir, que cada 100 semillas 20 tienen picaduras).
> # PROBABILIDAD DE UN VALOR EXACTO
> x1= 1 # Valor de conteo que se quiere calcular la probabilidad
> lamda=0.2 # En la distribución de Poisson lamda equivale a la media o a la varianza,
son el mismo valor
> dpois(x1,lamda) # La probabilidad de que en 100 semillas una tenga 1 picadura es de
0.1637 o de 16.37 por ciento
[1] 0.1637462
>
> ## DOS PICADURAS O MAS TOCA A UNO QUITARLE LAS PROBABILIDADES
DE CERO MAS LA DE UNO
> x0=0 # El valor de conteo que se quiere calcular la probabilidad, en este caso que
ninguna semilla tenga picaduras
> x2=1
> lamda=0.2 #media o varianza como es igual
> dpois(x0,lamda) # La probabilidad de que ninguna semilla tenga picaduras es de
0.8187 o del 81.87 por ciento
[1] 0.8187308
> 1-(dpois(x0,lamda)+dpois(x2,lamda)) # 1 menos la SUMA de la probabilidad de
tener cero picaduras mas una picdura (x0+x2)
[1] 0.0175231
> # La probabilidad de que 2 de las 100 semillas tengan picaduras es de 0.0175 o del 1.8
por ciento

Fase 3 - Grupo 1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Fase 3 - Grupo 1

Cargado por

Copyright:

Formatos disponibles

ESTADISTICA DESCRIPTIVA

UNIDAD 2: FASE 3 – DISTRIBUCIÓN Y PROBABILIDAD

LAURA MELISSA BACCA DOUSDEBES 1.119.894.286

DANNA NATHALY AVILA CASALLAS 1.007.702.259

JORGE LUIS ACERO RUEDA 1.070.959.147

WUYLMERT HELADIO SEGURA PINEDA 1.013.664.012

LUIS ALBERTO CACERES TORRES

UNIVERSIDAD ABIERTA Y A DISTANCIA UNAD

En el presente trabajo abordaremos temas de distribución y probabilidad en donde se

representaran resultados de manera gráfica de experimentos aleatorios de azar definiendo y

aplicando conceptos básico y de esta forma validar la posibilidad de la ocurrencia de los

posibles resultados que ya se tenían contemplados en el experimento, de igual manera se

Se denota con la letra E, S o Ω

B. Que es el punto muestral.

el espacio muestral de un experimento aleatorio

C. Que es un evento muestral.

D. Que es una variable aleatoria

interesante de la variable aleatoria es que permite aplicar análisis matemáticos a situaciones

E. ¿Qué significa que el espacio muestral de una variable aleatoria continua es no

discreto y el Espacio muestral continuo.

En el Espacio muestral discreto hay un número determinado de opciones conocidas, por

ya que estamos dentro de x número de opciones. En cambio, el Espacio muestral continuo es

generalmente estarán sujetos de error. [ CITATION Gar14 \l 3082 ]

F. ¿Qué son variables aleatorias discretas proporcionales y que son variables

aleatorias discretas de conteo no acotado? De ejemplos de este tipo de variables.

denominador natural. [ CITATION Gar14 \l 3082 ]

G. Existen dos conceptos de probabilidad: el clásico y el concepto frecuencial; defina

La probabilidad clásica es el número de resultados favorables a la presentación de un

simple del espacio muestral tiene la misma probabilidad de ocurrir.

La probabilidad frecuencial hace referencia a la probabilidad entendida como el cociente

tiende a infinito. [ CITATION Jos1 \l 3082 ]

H. En el caso de la probabilidad frecuencial, explique el experimento de germinación

de una semilla, cuál es el experimento aleatorio, cuál es el evento y cuantos puntos

Entonces la probabilidad de que germine una semilla es de 50%

Y como resultado A=Obtienes una planta o B=No obtienes nada

I. ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de

La frecuencia relativa se calcula con el cociente de la frecuencia absoluta de algún valor

de la población o la muestra, entre el total de valores que compone la población o la muestra.

La frecuencia de probabilidad hace referencia a la definición de probabilidad entendida

el número de casos tiende a infinito.

J. ¿Qué son eventos mutuamente excluyentes? ¿Cómo es la intersección de dos

eventos mutualmente excluyentes? ¿Si son excluyentes, dado un evento A y uno B,

a que es igual la P (AUB)?

al mismo tiempo, y la suma de sus probabilidades individuales es la probabilidad de que el

La probabilidad de la unión de dos sucesos incompatibles será igual a la suma de las

tanto no hay que restarle nada).

K. En el caso de distribuciones de variables aleatorias, si una variable es continua y

simétrica, ¿Qué modelo se usa?

densidad sea X~U ([a, b]) f (x) = 1/(b-a) para x E [a, b]

Para una variable de conteo no acotado ¿Qué modelo se utiliza?

Variables de interés: Y ∈ {0, 1, 2, . . .}, se debe analizar Y como función de variables

explicativa: E (Y |X1, X2, . . ., Xk)

M. Para una variable de conteo no acotado, ¿qué modelo se utiliza?

Para una variable de conteo no acotado el modelo usado es el modelo de distribución

binomial en el cual se determina la probabilidad de éxito constante Los resultados de cada

realización del experimento se clasifican en dos categorías probabilidad de éxito, y otra la de

N. Para variables de proporciones ¿qué modelo se utiliza?

Para la variable de proporciones el modelo que se utiliza es de distribución de pisson

fácilmente notables, esta distribución nos muestra la probabilidad de que ocurra un

determinado suceso en número de veces K en un intervalo determinado de tiempo, longitud,

O. ¿Qué variables tienen función de probabilidad y cuáles variables tienen función de

VARIABLES CON FUNCION DE PROBABILIDAD

VARIABLES CON FUNCION DE DENSIDAD