Está en la página 1de 17

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESCUELA DE CIENCIAS BASICAS TECNOLOGIA E INGENIERIA

ESTADÍSTICA DESCRIPTIVA (PARA AGRARIAS)


UNIDAD 2 - FASE 3 - DISTRIBUCIÓN Y PROBABILIDAD

TUTORA:
CAROLINA RUEDA ARTEAGA

PRESENTADO POR
LEIDY MARCELA CASTRO LOPEZ
(1124827888)

GRUPO:
300046_97

SAN JOSE DEL GUAVIARE


ABRIL/ 10/2021
INTRODUCIÓN
en el presente trabajo se aborda los temas de distribución y probabilidad esta nos va a
permitir asignar a diferenciar experimentos que realicemos un cierto grado de probabilidad
a obtener ciertos resultados, además nos permite tener una visión más holística ya que estos
temas podemos abordar en cualquier momento del desarrollo de nuestras carreras
permitiendo a través de programas r a obtener resultados precisos para así dar solución o
respuesta a interrogantes que se nos presenten en cualquier medio tanto estudiantil como
laboral.
1. Revisar el OVI y los Contenidos y referentes bibliográficos de la U
2. nidad 2, ubicados en el Entorno de Aprendizaje y explicar en sus propias palabras
los siguientes términos:
a. Espacio muestral, con qué letra se denota.
El espacio muestral es el conjunto de todos los datos que se pueden obtener como resultado
o los posibles resultados del experimento o ensayo que se esté realizando y se denota de la
siguiente manera: (Ω).
b. Punto muestral.
el punto muestral es uno de los elementos que contiene el espacio muestral ósea un
resultado de este. (ω)
c. Evento muestral.
el evento muestral es un subconjunto del espacio muestral que contiene una seria de
posibles resultados
d. Variable aleatoria
la variable aleatoria asigna un valor que generalmente es numérico, un resultado a un
experimento, los posibles resultados.

e. ¿Qué significa que el espacio muestral de una variable aleatoria continua es no


contable?
Se dice que el espacio muestral de una variable aleatoria continua es no contable debido a
que no podemos deducir el posible resultado ya que existe una gran variabilidad de datos y
no se puede dar un numero exacto de opciones
f. ¿Qué son variables aleatorias discretas proporcionales y que son variables
aleatorias discretas de conteo no acotado? De ejemplos de este tipo de variables.
Las variables aleatorias discretas proporcionales son aquellas que pueden tener un numero
finito de valores dentro de ciertos intervalos por ejemplo cantidad de árboles en un bosque.
Las variables aleatorias discretas de conteo no acotado son aquellas que pueden tener
ciertos valores con mayor frecuencia números enteros como por ejemplo número de puntas
de un triángulo.
g. Existen dos conceptos de probabilidad: el clásico y el concepto frecuencial; defina
cada uno. Rta: PROBABILIDAD CLASICA
Cuando es finito (el número de puntos muéstrales es contable) se puede dar una
definición de probabilidad que se basa en la observación de los elementos del espacio
muestral. Ésta se desarrolló originariamente estudiando los juegos de azar. y se conoce
como el concepto o enfoque clásico de probabilidad: Si A es un subconjunto de puntos
muéstrales de , entonces la probabilidad de ocurrencia del evento A, denotada por P(A) .
PROBABILIDAD (CONCEPTO FRECUENCIAL)
La definición frecuencial de probabilidad es distinta ya que se refiere a una serie repetida
de estudios aleatorios. Generalmente se usa cuando el espacio muestral es infinito y por
tanto no se pueden enumerar todos los resultados posibles del estudio. Así, se repite el
estudio un número grande de veces y se registra la frecuencia relativa de ocurrencia de cada

h. En el caso de la probabilidad frecuencial, explique el experimento de germinación


de una semilla, cuál es el experimento aleatorio, cuál es el evento y cuantos puntos
muestrales tiene.
RTA: la definicó frecuencial de probabilidad establece que : A es un evento y n ^A es el
número de veces que A ocurre en N repeticiones independiente del experimento , la
probabilidad del evento A , denominada p (A) , se define como el límite , cuando el
número de repeticiones del esperimento es grande , dela frecuencia relativa asociada con el
evento .

Ejemplo.
Consideramos la germinación de una semilla es un experimento aleatorio ( puede
germinar o no ) , su pongamos que A se presenta el evento ¨ encontrar la semilla
germinada´´
Experimento aleatorio.

Si se observa 1000 semillas, es decir se repite 1000 veces el ensayo de germinación (N=
1000) en condiciones tales que cada observación no afecte a las otras y 600 semillas
germinan ( n A= 600).

Evento aleatorio.

Semillas que germinan


Punto muestral
1000 semillas ( germinan o no )

i. ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de probabilidad?


RTA: Como sabes la frecuencia absoluta de un suceso es el número de veces que aparece
cuando se repite un experimento aleatorio, y la frecuencia relativa es la frecuencia absoluta
dividida por el número de veces, n, que se repite el experimento aleatorio.

j. ¿Qué son eventos mutuamente excluyentes? ¿Cómo es la intersección de dos eventos


mutuamente excluyentes? ¿Si son excluyentes, dado un evento A y uno B, a que es
igual la P(A ꓴ B)?

k. En el caso de distribuciones de variables aleatorias, si una variable es continua y


simétrica, ¿qué modelo se usa?
RTA: Una variable aleatoria X o, equivalentemente, su distribución, es simétrica alrededor
de un punto
α ∈ R si
P(X ≤ α + x) = P(X ≥ α − x), ∀x ∈ R.
Una variable aleatoria X es simétrica alrededor de un punto α ∈ R si y solo si se cumple
alguna de las siguientes
condiciones equivalentes:
i) Las variables aleatorias X − α y α − X tienen la misma distribución.
ii) FX(α + x) = 1 − FX(α − x) + P(X = α − x), ∀x ∈ R.

l. Para una variable de conteo no acotado, ¿qué modelo se utiliza?


Para esta variable se utiliza el modelo de Poisson, esta es la ideal cuando la variable
dependiente es un conteo, puedo resumirlo como los sucesos que ocurren varias veces en
un tiempo definido.

m. Para variables de proporciones ¿qué modelo se utiliza?


Para esta variable se utiliza el modelo de regresión el cual nos permite analizar las
relaciones entre varias variables para identificar la mejor en un proyecto de interés.

n. ¿Qué variables tienen función de probabilidad y cuáles variables tienen función de


densidad?
La probabilidad es una función unida a cada punto de su espacio maestral, es la muestra de
que esta la asuma, también puedo resaltar que probabilidad se asocia a la probabilidad del
suceso y que esta solo tiene lugar para las varíales aleatorias que asumen un conjunto
discreto de valor, y para la función de densidad tienden las variables continuas.

o. ¿Cuáles son los parámetros más usados en estadística para estudiar y utilizar
funciones de distribución de variables aleatorias?
El parámetro en estadística se refiere a un nuero que puede resumir una cantidad de datos,
los principales parámetros son,
medidas de posición,
medida de dispersión,
medida de forma,

p. ¿Qué es la esperanza matemática de una variable aleatoria? ¿cómo se denota?


En teoría de probabilidad, la varianza o variancia (que suele representarse como) de
una variable aleatoria es una medida de dispersión definida como
la esperanza del cuadrado de la desviación de dicha variable respecto a su media. O en
pocas palabras, la media de los residuos al cuadrado.
Se denota con la siguiente formula pi=P ¿)
Esta se calcula como la media aritmética de valores, así como la suma de los valores por
sus probabilidades.

2. Lea el Capítulo 3 – Modelos probabilísticos del libro Estadística y Biometría de


Mónica Balzarini y responda las siguientes preguntas:
a. Qué tipo de histograma se debe seleccionar en un modelo probabilístico para una
variable aleatoria continua cuando se tienen datos de esa variable.
Para seleccionar un modelo probabilístico para una variable aleatoria continua cuando se
tienen datos de esa variable, se recomienda graficar un diagrama de frecuencia relativas y
observar la forma de este. Donde se superponen funciones de modelos probalisticos
teóricos que ajustan relativamente bien las formas de los histogramas.
b. Qué es la estandarización, cuál es su fórmula.
La estandarización es una transformación, es una norma estándar donde se expresa nuestra
variable para el uso de las tablas. Esta transformación nos permite llevar cualquier
distribución normal estándar. La importancia de esta transformación radica en que las
probabilidades que se obtendrían a partir de la distribución original de la variable (Y) son
igual a las obtenidas luego de estandarizar la variable (Y) y buscar los valores de
probabilidad asociados a os valores de (Z) en una tabla de normal estándar.
Formula:
Y −μ
Z=
√ σ2
Donde Y es el valor de la variable aleatoria que define el evento de interés, μyσ 2 son las
media y la varianza de la distribución de Y. la nueva variable aleatoria Z, obtenida
mediante estandarización de Y, se distribuye normal con media cero y varianza uno, es
decir normal estándar.

c. Qué tipo de conteos se trabajan con la distribución Binomial.


en la distribución binominal se trabaja con conteos acostados, estos procedimientos son
independientes, es decir que el resultado de un experimento no afecta o interviene en el
resultado de otro y que la probabilidad de éxito o fracaso se mantiene constante a través del
conjunto de experimentos.
d. En la distribución binomial qué es n y qué es P.
n = es el numero de ensayos
p = probabilidad del éxito
e. A qué es igual la esperanza y la varianza en la distribución binomial.
La esperanza en la distribución binominal es igual al numero de repeticiones de
experimentos, multiplicado por la probabilidad de ocurrencia o éxito, así nxP. La varianza
es igual al numero de repeticiones del experimento, multiplicado dos veces por la
probabilidad, así: nxPxP.
f. Mencione ejemplos en su área de estudio donde se podría utilizar la distribución
Binomial.
 análisis de agua residual en pH.
 toma de muestra de material particulado
g. Qué tipos de conteos se trabajan con la distribución de Poisson.
Con la distribución de Poisson se trabajan conteos que hacen referencia al número de veces
que un evento ocurre en una unidad de tiempo o espacio determinada. Como, por ejemplo:
hora, metro cuadrado, metro cubico, planta, entre otros
h. Cómo se denota el único parámetro de la distribución de Poisson.
El parámetro de la distribución de Poisson se denota con 
i. ¿A qué es igual la media y la varianza en la distribución de Poisson?
La varianza de Poisson aumenta a medida que aumentan los conteos y esta es función de la
media
j. Mencione ejemplos en su área de estudio donde se podría utilizar la distribución de
Poisson.
10. Abra “Script Fase 3 - DADOS.txt”, ejecútelo y responda las siguientes preguntas:
a. Explique en sus propias palabras el experimento aleatorio del dado. Este ejercicio
nos ayudará a entender los conceptos de probabilidad y distribución.
En el experimento aleatorio del dado cumplen dos condiciones la primera es que se puede
repetir un numero infinito de veces y la segunda es que sabemos todos los posibles
resultados que podemos obtener, como acabamos de mencionar conocemos los posibles
números que podamos obtener de los dados por esto el espacio muestral que tendremos
seria: E = (1,2,3,4,5,6) En este caso al realizar las combinaciones que podremos obtener
vamos a tener un total de 36 opciones de probabilidad de obtener esa combinación.
Además, también tenemos la opción de la suma de las caras los cuales tenemos un intervalo
del 2 al 12.
b. Adjunte en el informe los tres gráficos generados por el script (Frecuencias
Absolutas, frecuencias relativas y frecuencias relativas acumuladas). No debe haber
más de un gráfico por página.
PERIODO 951 - Gráfico de barras SUMA DE CARAS

6
5
4
Frecuencias absolutas

3
2
1
0

2 3 4 5 6 7 8 9 10 11 12

 El anterior grafico nos muestra que al jugar a los dados tenemos mas probabilidades
de obtener el numero 7 en la suma de las caras y que igualmente con menor
probabilidad obtendremos los numero 2 y 12.

PERIODO 951 - FRECUENCIAS RELATIVAS SUMA DE CARAS


0.20
0.15
Frecuencias relativas

0.10
0.05
0.00

2 3 4 5 6 7 8 9 10 11 12

 En esta grafica podemos confirmar lo anteriormente dicho, ya que tenemos


aproximadamente el 16% de posibilidad de obtener el numero 7 en la suma de sus
caras y que existe la probabilidad de una 2% a 3% de obtener valores como 2 y 12.
PERIODO 951 - FRECUENCIAS RELATIVAS ACUMULADAS SUMA DE CARAS

1.0
0.8
Frecuencias relativas

0.6
0.4
0.2
0.0

2 3 4 5 6 7 8 9 10 11 12

 En el anterior grafico se puede evidenciar que el porcentaje de obtener los números


más altos se ve reflejado con la cantidad de repeticiones que se hagan en este caso
existe un 10% de probabilidad de que al jugar los dados adquiramos en su suma el
número 12 y con menor probabilidad en este caso de un 1% de obtener de la suma
el número 2. Por lo tanto, entre más intentemos o entre más repeticiones realicemos
tendremos siempre mayor posibilidad de obtener los números más altos

c. Haga una breve descripción y explicación de cada uno de los gráficos adjuntados.
Recuerde que no debe poner pantallazos en su informe, para presentar los gráficos
debe hacer clic sobre el gráfico con el botón derecho del mouse y seleccionar “Copiar
como metafile” para posteriormente pegarlo (“Control+V”) en su informe.
11. Abra en el programa R “Script Fase 3 – MODELOS.txt” y ejecútelo de acuerdo a las
indicaciones dadas previamente. Este script dará respuesta a los ejercicios del libro
“Estadística y Biometría de Mónica Balzarini” en el Capítulo 3 – Modelos probabilísticos;
describa los ejercicios y responda las siguientes preguntas:
a. Distribución normal - Ejercicio de las vacas del tambo (página 91).
i. Presente y describa el gráfico "Producción de leche - Función de Distribución N
(misma varianza, distinta media)". Este gráfico muestra dos distribuciones dentro de
la misma gráfica -una azul y otra roja-. Para obtenerlo, cuando aparezca la gráfica de
distribución de color azul, NO LA CIERRE, continúe ejecutando el script (para
volver al script, ubique el cursor en el marco azul, donde aparece el nombre del script,
para que no pierda la secuencia de ejecución).
PERIODO 951 - Producción de leche Función de Distribución N (misma varianza, distinta media

0.12
0.10
0.08
0.12
F(x)

0.06
0.10
0.04
dnorm(x, MEDIA2, SIGMA)
0.02
0.08
0.00
0.06

10 15 20 25 30 35 40

Producción de leche (litros/día)


0.04
0.02
0.00

10 15 20 25 30 35 40

En las grafica anterior podemos observar x que cambia la ubicación de la media


(esperanza), sin embargo, la forma que expresan las gráficas son las mismas ya que no
cambio la varianza.

ii. Presente y describa el gráfico "Producción de leche - Función de Distribución N


(misma media, distinta 5 varianza". Al igual que el anterior, muestra dos
distribuciones en la misma gráfica, cada una con distinta varianza, cuando le
aparezca el primer gráfico (color azul) no lo cierre y continúe ejecutando el script
hasta que le aparezca la segunda línea de distribución (color rojo).
PERIODO 951 - Rendimiento de maíz - Función de Distribución N(media.sigma)
0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Rendimiento (qq/Ha)

En el presente diagramas podemos evidenciar que las gráficas poseen la misma media o
esperanza, aunque sus cambiaron y que tiene distinta varianza, a mayor varianza, la grafica
poseerá mayor amplitud.

b. Probabilidad en distribución normal - Ejercicio del híbrido de maíz (página 93).


i. Presente y describa el gráfico “Rendimiento de maíz - Función de Distribución N
(media. sigma)”
PERIODO 951 - Rendimiento de maíz - Función de Distribución N(media.sigma)

0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Rendimiento (qq/Ha)

en este grafico nos muestra que Y es igual al rendimiento de un hibrido de maíz que puede
moderarse con una distribución normal, donde el numero de media es igual a 60 qq/Ha y la
varianza es de 49 qq/Ha
ii. Indique los valores de media (µ) y sigma (σ).
Media= 60 qq/Ha
Varianza= 49 qq/Ha
Sigma= sqrt (varianza)
Sigma X= seq (35,85, by = 0.5)
Dnorm (X, media, sigma

iii. Indique la probabilidad de que el rendimiento sea igual o menor que 50 qq/Ha.
Especificamos el valor del que queremos saber su probabilidad, en este caso, 50:
Valor= 0
Pnorm (valor, media, sigma)
Esto quiere decir que la probabilidad de que el rendimiento este por debajo de 50 qq/Ha es
de 0.076 o del 7.65%
iv. Indique la probabilidad de que el rendimiento sea mayor que 50 qq/Ha.
Para allar la probabilidad de un valor mayor que 50, se resta 1 menos la probabilidad de
hallar un valor igual o menor:
1- Pnorm(valor, media, sigma)
En este caso, la probabilidad de que el rendimiento este por encima de 50 qq/Ha, es de
0.923 o el 92.3 %
v. Indique la probabilidad de que el rendimiento se encuentre entre 50 y 65 qq/Ha.
Probabilidad que un dato de rendimiento tomado al azar esté comprendido en el intervalo
de 50 a 65 qq/Ha:
Reemplaze por el rango de valores, valor 2 es el mayor y valor 1 es el menor:
valor1=50
valor2=65
probabilidad que el rendimiento se encuentre en el intervalo de 50 a 65 qq/Ha:
VALOR2-VALOR1
Se resta la probabilidad de que el rendimiento esté por debajo de 65 qq/Ha (p=0.762),
menos la probabilidad de que esté por debajo de 50 qq/Ha (0.0765)
regionX=seq(valor1,valor2,0.01
vi. Presente y describa el gráfico “Rendimiento de maíz Distribución Normal con área
bajo la curva”

PERIODO 951 - Rendimiento de maíz Distribución Normal con área bajo la curva
0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Rendimiento (qq/Ha)

En esta grafica se puede observar los valores de la probabilidad para la varianza en este
caso seria
Xp ← c (valor 1, regiónX, valor 2) = base de los polígonos que crea el efecto sombra.
yP ← c (0, Dnorm(regionX, media, sigma),o) = altura de los polígonos sombreados
Y el área que se encuentra bajo la curva nos representa que va desde 0 hasta el 100% de los
casos, en este caso presenta un rango de 45 a 63 de rendimiento de kg/Ha.
3. Presenta los resultados obtenidos en el programa R (R Console) al ejecutar la
totalidad del “Script Fase 3 – MODELOS.txt”

c. Distribución binomial - Ejercicio de la semilla de Panicum sp. (página 102).


i. Indique la probabilidad de que germinen 7 de las 10 semilla
se toman 10 semillas de Panicum sp y se registra el evento "Germinó "o "No germinó",
después de 5 días desde su implantación:
k= 7 = Queremos saber la probabilidad que germinen 7 de las 10 semillas
n= 10 = Número total de ensayos realizados, en este caso son 10, que fueron el número de
semillas evaluadas
p= 0.25 = La probabilidad de germinación de las semillas fue del 25 por ciento
ii. Indique la probabilidad de que germinen al menos 3 de las 10 semillas.

iii. Indique la probabilidad de que germinen 3 o más semillas.


La probabilidad de que germinen 3 o más semillas es de 0.4744 o del 47.44 por ciento
iv. Indique la probabilidad de que germinen a lo sumo 5 semillas.
La probabilidad de que germinen a lo sumo 5 semillas, es de 0.98 o del 98 por ciento
v. Indique la esperanza (E) de esta variable aleatoria.
La esperanza es de 2.5
vi. Indiqué la varianza (V) de esta variable aleatoria.
La varianza es de 1.875
vii. Presente y describa el gráfico “Distribución Binomial - Germinación de semillas\
n(n=10,p=0.25)”
PERIODO 951 - Distribución Binomial - Germinación de semillas
(n=10,p=0.25)
0.25
0.20
Probabilidad del evento

0.15
0.10
0.05
0.00

0 1 2 3 4 5 6 7 8 9 10

Evento (germinación de x semillas)

este gráfico muestra la probabilidad de ocurrencia de cada uno de los 11 eventos posibles,
es decir que germinen 0 semillas, 1.., hasta 10. En este caso, cuando p es menor que 0.5, la
distribución se encuentra sesgada positivamente hacia la izquierda

d. Distribución Poisson - Ejercicio de las picaduras de gorgojo (página 105).


i. Indique la probabilidad de que en 100 semillas una tenga 1 picadura.
La probabilidad de que en 100 semillas una tenga 1 picadura es de 0.1637 o de 16.37 por
ciento
ii. Indique la probabilidad de que en 100 semillas dos o más tengan picaduras.
La probabilidad de que 2 de las 100 semillas tengan picaduras es de 0.0175 o del 1.8 por
ciento
iii. Indique la probabilidad de que en 100 semillas ninguna tenga picaduras.
La probabilidad de que 2 de las 100 semillas tengan picaduras es de 0.0175 o del 1.8 por ciento

También podría gustarte