Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Fase 3 - Grupo 1
Fase 3 - Grupo 1
OCTUBRE 2020
FACATATIVA
Introducción
realizaran análisis rápidos en base a las gráficas obtenidas desde el software "Programa R"
siguiendo las indicaciones propuestas por el tutor y fortaleciendo conocimientos que se han
venido aprendiendo durante el desarrollo del curso estadística descriptiva (para agrarias).
A. Que es el espacio muestral, con qué letra se denota.
El espacio muestral se conoce como el conjunto de todos los resultados posibles al realizar
un experimento aleatorio, algo particular es que se puede realizar los experimentos las veces
que sean necesarias bajo las mismas condiciones siempre sabiendo el conjunto de posibles
resultados.
Los puntos muestrales se conocen como todos los posibles elementos que se encuentran en
Es un subconjunto del espacio muestral, es decir uno o varios elementos dentro del
experimento aleatorio.
Una variable aleatoria es una función real medibles que asocia un valor numérico a cada
resultado del espacio muestral el cual está asociado a un experimento aleatorio, algo
con incertidumbre
contable?
Los espacios muestrales se han dividido en dos categorías que son: Espacio muestral
ejemplo: 6 caras en un dado. No es posible obtener más de seis posibilidades. Están limitadas,
variabilidad que vamos a tener, no suele ser muy exacta, porque depende del instrumento
utilizado y el juicio del espectador. Esto quiere decir que los datos que tengamos
Las variables aleatorias discretas proporcionales son un numero finito o lo más numerable
de valores. Por ejemplo, el número exacto de una cantidad en una manada de caballos.
Las variables aleatorias discretas de conteo no acotado es cuando la variable solo es capaz
de poder adquirir un numero finito de valores dentro de un intervalo, lo que quiere decir que
es aleatoria discreta. Por ejemplo, el número de semillas germinadas en las cajas de Petri con
25 semillas cada caja. Los resultados se expresarían como proporciones porque existe un
cada uno.
evento dividido entre el número total de resultados posibles. Se aplica cuando cada evento
entre el número de casos favorables y el número de casos posibles, cuando número de casos
muestrales tiene.
El punto muestral es una semilla.[ CITATION Jos1 \l 3082 ][ CITATION Gar14 \l 3082 ]
probabilidad?
como el cociente entre el número de casos favorables y el número de casos posibles, cuando
Los eventos mutualmente excluyentes se dan cuando dos o más eventos no pueden suceder
evento ocurra.
probabilidades de cada uno de los sucesos (ya que su intersección es el conjunto vacío por lo
Dada una variable aleatoria continua X, definida en el intervalo [a, b] de la recta real,
diremos que X tiene una distribución uniforme en el intervalo [a, b] cuando su función de
punto a Er
P (X ≤ α + x) = P (X ≥ α − x), ∀x ∈ R.
fracaso.
debido a que este modelo se emplea para describir varios procesos, y asume valores enteros
área y demás.
densidad?
Distribución binomial
Distribución de poisson
Distribución t-Student
Distribución F-Snedecor
P. ¿Cuáles son los parámetros más usados en estadística para estudiar y utilizar
Media
Probabilística
Aritmética
Geométrica
Armónica
Cortada
Mediana
Moda
probabilidades de que exista un suceso aleatorio, multiplicado por el valor del suceso
aleatorio. Dicho de otra forma, es el valor medio de un conjunto de datos. Esto, teniendo en
cuenta que el término esperanza matemática está acuñado por la teoría de la probabilidad.
preguntas:
El experimento aleatorio del dado nos dice que de dos dados pueden tener 36
posibles resultados ya que al combinar cada uno con los demás van arrojando
diferentes opciones así que al realizar varios lanzamientos no se sabrá cual será el
0.6
0.4
0.2
0.0
2 3 4 5 6 7 8 9 10 11 12
sumar las dos caras es del 0.027 y este a su vez al ir realizando más experimentos aleatorios y
sumando las caras nos va arrojando la probabilidad que hay de obtener un mayor resultado
Frecuencias Absolutas
4
3
2
1
0
2 3 4 5 6 7 8 9 10 11 12
veces que se repite el número de pruebas aleatorias al arrojar los dados y así obteniendo el
0.10
0.05
0.00
2 3 4 5 6 7 8 9 10 11 12
experimento aleatorio en donde los valores que se observan el eje x el resultado de la barra
que indica el numero 7 tiene mayor número de veces de arrojar el resultado según los valores
del eje y.
"Producción de leche - Función de Distribución N (misma varianza, distinta media)
0.06
0.04
0.02
0.00
10 15 20 25 30 35 40
En esta grafica nos indica como la frecuencia relativa para la producción de leche, se
representa con una frecuencia de 0.12 en el valor del eje x, por cada 25Lt (litros) de leche en
0.2
0.1
0.0
10 15 20 25 30 35 40
en los valores del el eje y, en una frecuencia de 0,1 en los valores del eje x.
PERIODO 764 - Rendimiento de maíz Distribución Normal con área bajo la curva
0.05
0.04
0.03
F(x)
0.02
0.01
0.00
20 40 60 80 100
Rendimiento (qq/Ha)
los valores alcanzados en cada una de las variables de siembra, se obtuvo un crecimiento
0.15
0.10
0.05
0.00
0 1 2 3 4 5 6 7 8 9 10
evento #2 el más alto nivel de frecuencia obteniendo una probabilidad después de 0.25
niveles de probabilidad .
14. Lea el Capítulo 3 – Modelos probabilísticos del libro Estadística y Biometría de
de probabilidad a cada punto del espacio muestral. En el caso de las variables aleatorias
Variable Continua La probabilidad asociada a una variable continua, está representada por
rango -∞ a + ∞ se define:
común.
Hay un procedimiento que funciona como una especia de bala de plata para todos estos casos:
media y dividiendo esto entre la desviación típica. Formalmente, dada una muestra
x1,x2,...,xn, calculamos:
xi−X
Zi =
Sx
Usualmente en la literatura nos dirán que esta nueva variable Z no tiene unidades, y esto es
cierto. Sin embargo, una manera de interpretar los valores zi es pensar que está expresada en
desviaciones típicas. Efectivamente, si z1=1, esto significa que xi está una desviación típica
por encima de la media. Por ejemplo, si xi=20, la media X¯=15 y la desviación típica
Sx=5SX=5, zi = (20−15) / 5=1, y como podemos ver, xi está una desviación típica por
encima de la media.
n = Número de ensayos/experimentos
x = Número de éxitos
Media
En una distribución binomial, la media nos indica el valor medio de un fenómeno aleatorio.
Donde:
n es el número de ensayos
p es la probabilidad de éxito
Varianza
Es una medida de dispersión que nos indica qué tan lejos se encuentran los cuadrados de la
Donde:
n es el número de ensayos
p es la probabilidad de éxito
q es la probabilidad de fracaso
Binomial.
población entera, por lo que se examina una parte de ella y en base a la información relevada
Variables
Las observaciones o mediciones sobre los elementos de una población constituyen la
materia prima con la cual se trabaja en Estadística. Para que dichas observaciones puedan ser
numéricos. Aunque sea obvio, se destaca que la característica de interés a observar o medir
en cada elemento de la población debe ser la misma, en tanto que se espera que no asuma el
mismo valor en cada uno de los elementos que la conforman. Aquellas características que van
"variables", mientras que aquellas que no cumplen esta condición son llamadas "constantes".
a) xi, i=1,...,6 hace referencia taxativamente a los valores observados x1, x2, x3, x4, x5, y
b) xi, i=1,... en este caso i puede valer a partir de 1 en adelante y hasta infinito.
c) xi, i=0,1,... en este caso i puede valer desde cero hasta infinito.
Tipos de variables
numerable1. En otras palabras, existe una cantidad infinita de posibles valores para los
corchetes, por ejemplo, [a, b] denota al conjunto de todos los x tal que a ≤ x ≤ b.
paréntesis, por ejemplo, (a, b) denota al conjunto de todos los x tal que a < x < b.
c) Un intervalo es semi-cerrado (o semi-abierto) si uno de sus extremos no pertenece al
mismo, lo que se denotará con el corchete y el paréntesis que corresponda. Por ejemplo, (a, b]
Función de cuantía
A partir de las hipótesis del proceso, se obtiene una ecuación diferencial de definición del mismo que
puede integrarse con facilidad para obtener la función de cuantía de la variable "número de hechos
que ocurren en un intervalo unitario de tiempo o espacio
luego :
Así.
haciendo t = 0
por lo que =
así se observa que media y varianza coinciden con el parámetro del modelo
siendo, l
En cuanto a la moda del modelo tendremos que será el valor de la variable que tenga mayor
probabilidad , por tanto si Mo es el valor modal se cumplirá que :
Y, en particular:
A partir de estas dos desigualdades, es muy sencillo probar que la moda tiene que
verificar: De manera que la moda será la parte entera del parámetro l o dicho de
otra forma, la parte entera de la media
Podemos observar cómo el intervalo al que debe pertenecer la moda tiene una amplitud de una
unidad, de manera que la única posibilidad de que una distribución tenga dos modas será que los
extremos de este intervalo sean números naturales, o lo que es lo mismo que el parámetro l sea
entero, en cuyo caso las dos modas serán l -1 y l.
Teorema de adición.
"La variable suma de dos o más variables independientes que tengan una distribución de Poisson de
distintos parámetros l (de distintas medias) se distribuirá, también con una distribución de Poisson
con parámetro l la suma de los parámetros l (con media, la suma de las medias):
En efecto:
Sean x e y dos variables aleatorias que se distribuyen con dos distribuciones de Poisson de distintos
parámetros siendo además x e independientes
Así e
Debemos probar que la variable Z= x+y seguirá una Poisson con parámetro igual a la suma de los
de ambas:
Para Y
De manera que la función generatriz de momentos de Z será el producto de ambas ya que son
independientes :
Se puede probar que la distribución binomial tiende a converger a la distribución de Poisson
cuando el parámetro n tiende a infinito y el parámetro p tiende a ser cero, de manera que el
producto de n por p sea una cantidad constante. De ocurrir esto la distribución binomial tiende a un
modelo de Poisson de parámetro l igual a n por p
Este resultado es importante a la hora del cálculo de probabilidades , o , incluso a la hora de inferir
El resultado se prueba , comprobando como la función de cuantía de una distribución binomial
El planteamiento de la estimación podría hacerse utilizando información suministrada por una
experiencia {las observaciones de cuántos hechos se producen en un intervalo experimental),
conjuntamente con algún otro tipo de información a priori. En este caso, estaríamos, como ya
comentábamos en el caso binomial ante un planteamiento bayesiano del problema.
La solución requerirá que dispongamos de una información inicial que puede especificarse a través
de una distribución a priori de probabilidad. De manera que la función de cuantía de esta
distribución a priori (o su f. de densidad si fuera continua) nos asigne probabilidades a cada posible
valor del parámetro l.
Pero realizando una experiencia podremos mejorar la información acerca de l Si observamos la
realización de hechos durante un intervalo experimental y se producen x hechos, para cada posible
valor de l podremos calcular su verosimilitud definida como la probabilidad de que se dé ese
resultado si el valor de l es el considerado:
La estimación mejorada del parámetro será, entonces, la media de la distribución a posteriori.
Planteamos un ejemplo:
Tres ejecutivos del Insalud opinan que el número medio de pacientes que llegan a cierto servicio
nocturno de guardia durante una hora es 2, según el primero, 3, según el segundo, y 5 según el
tercero.
Sus opiniones pueden ponderarse teniendo en cuenta que el primero tiene el doble de
experiencia profesional que los otros dos.
Para tomar una decisión de asignación de personal en ese servicio quieren estimar el número
medio de pacientes, sin despreciar sus opiniones, por lo que realiza una experiencia controlando una
hora de actividad en el servicio en la que acuden 3 pacientes. Esta información la van a combinar con
la inicial a través de un proceso Bayesiano.
donde
otra de parámetro λ es
i. ¿A qué es igual la media y la varianza en la distribución de Poisson?
Calculo directo
es la función masa de probabilidad de una variable P(λ), por lo que la suma de esos
valores es la unidad.
j. Mencione ejemplos en su área de estudio donde se podría utilizar la distribución de
Poisson.
Variables
materia prima con la cual se trabaja en Estadística. Para que dichas observaciones puedan ser
numéricos. Aunque sea obvio, se destaca que la característica de interés a observar o medir
en cada elemento de la población debe ser la misma, en tanto que se espera que no asuma el
mismo valor en cada uno de los elementos que la conforman. Aquellas características que van
"variables", mientras que aquellas que no cumplen esta condición son llamadas "constantes".
a) xi, i=1,...,6 hace referencia taxativamente a los valores observados x1, x2, x3, x4, x5, y
b) xi, i=1,... en este caso i puede valer a partir de 1 en adelante y hasta infinito.
c) xi, i=0,1,... en este caso i puede valer desde cero hasta infinito.
Tipos de variables
numerable1. En otras palabras, existe una cantidad infinita de posibles valores para los
corchetes, por ejemplo, [a, b] denota al conjunto de todos los x tal que a ≤ x ≤ b.
b) Un intervalo es abierto si sus extremos no pertenecen al mismo, lo que se denotará con
paréntesis, por ejemplo, (a, b) denota al conjunto de todos los x tal que a < x < b.
mismo, lo que se denotará con el corchete y el paréntesis que corresponda. Por ejemplo, (a, b]
probabilidad y distribuciones de probabilidad, que suelen ser las más usadas en el campo de
aleatorios, aplicando los conceptos básicos ya explicados y así mismo poder validar la
análisis breves en cuanto a las gráficas que se obtuvieron desde el software “Programa R”
siguiendo las indicaciones regidas por el tutor, también fortaleciendo los conocimientos que
se han ido conociendo y aprendiendo durante este curso de Estadística Descriptiva (para
agrarias).
Bibliografía
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/48802
https://economipedia.com/definiciones/probabilidad-frecuencial.html
http://www.agro.unc.edu.ar/~mcia/archivos/Estadistica%20y%20Biometria.pdf
Obtenido de
https://aulavirtual.agro.unlp.edu.ar/pluginfile.php/2968/mod_resource/content/0/Estad
istica_para_las_Ciencias_Agropecuarias_-_Di_Rienzo.pdf
Resultados obtenidos en el programa R
Código DADO
>
> # Hay 36 posibles resultados, que da de combinar cada número con los demás
> # Iniciamos con el número 1 en el primer dado y lo vamos combinando con las seis
> # Hacemos lo mismo con el número 2 del primer dado y las seis combinaciones que
> # hasta obtener una matriz de ESPACIO MUESTRAL como se presenta a continuación:
>
ESPACIO MUESTRAL
> # Los eventos son subconjuntos del espacio muestral (los 36 posibles resultados del
dado)
> # Por ejemplo, un evento puede ser que en ambos dados salgan números pares (2,2 4,4
6,6)
> # Otro evento puede ser sacar dos números iguales, en donde se tendrían los siguientes
posibles resultados:
> # En este caso habrían 6 resultados de éxito de los 36 posibles del espacio muestral.
> # La probabilidad por tanto de obtener dos números iguales sería: 6/36 = 0.166 O 16,6%
en términos porcentuales
>
> # Es otra forma de presentar los 36 posibles eventos del espacio muestral, en donde se
>
>
>
> PROCESAMIENTO EN R
>
> # Creamos el vector con los datos sumando los valores de cada dado, como se indicó
anteriormente
> # EJEMPLO:
> # (1,1),(1,2),(1,3),(1,4),(1,5),(1,6)
(6,6):
>
> SUMADADOS=c(2, 3, 4, 5, 6, 7,
+ 3, 4, 5, 6, 7, 8,
+ 4, 5, 6, 7, 8, 9,
+ 5, 6, 7, 8, 9, 10,
+ 6, 7, 8, 9, 10, 11,
>
"SUMADADOS":
>
>
SUMADADOS
2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
> fabs
SUMADADOS
2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
> fabsacum
2 3 4 5 6 7 8 9 10 11 12
1 3 6 10 15 21 26 30 33 35 36
SUMADADOS
2 3 4 5 6 7 8
9 10 11 12
> # Podemos decir entonces que la probabilidad que la suma de las dos caras sea igual a 2
>
> frelacum
2 3 4 5 6 7 8
9 10 11 12
> # En este caso, la probabilidad de obtener un valor mayor o igual a 2 pero menor de 4 es
de 0.083 o 8.3%
= 0.083
>
> # GRAFICOS DE FRECUENCIAS:
>
>
Codigo Modelos
>
> # DISTRIBUCION NORMAL
> # EJERCIO DE LAS VACAS DEL TAMBO, Libro Estadística y Biometría de Mónica
91
> # La producción de leche diaria de las vacas de un tambo se distribuye como el modelo
normal, con esperanza 25 litros (que es la misma media) y varianza de 9 litros al cuadrado:
> MEDIA=25
> VARIANZA=9
> # A las vacas se les da una nueva ración que aumenta su producción en 5 litros, pero no
> MEDIA2=30
> SIGMA=sqrt(VARIANZA)
15 a 40 litros
> dnorm(x,MEDIA,SIGMA)
>
> # POR FAVOR NO LO CIERRE, ya que sobre este mismo aparecerá el siguiente
>
> curve(dnorm(x,MEDIA,SIGMA),xlim=c(10,40),col="blue",lwd=2,
> # se puede observar que cambia la ubicación de la media (esperanza), pero la forma de
>
> # Ahora se realiza el mismo procedimiento pero en este caso no cambia la media
>
> MEDIA=25
> VARIANZA=9
> VARIANZA1=2
> SIGMA=sqrt(VARIANZA)
> SIGMA1=sqrt(VARIANZA1)
> x=seq(15,40,by=0.5)
> dnorm(x,MEDIA,SIGMA)
[1] 5.140930e-04 8.836587e-04 1.477283e-03 2.402033e-03 3.798662e-03
[51] 4.955732e-07
>
> # POR FAVOR NO LO CIERRE, ya que sobre este mismo aparecerá el siguiente
>
> curve(dnorm(x,MEDIA,SIGMA),xlim=c(10,40),ylim=c(0,0.4),col="blue",lwd=2,
>
> # Este gráfico (de color rojo) le debe aparecer junto con el anterior gráfico de color azul,
en la misma gráfica:
>
> # En este caso ambas gráficas tienen la misma media (o esperanza) pero sus formas
>
>
> media= 60
> varianza= 49
> sigma=sqrt(varianza)
> sigma
[1] 7
> dnorm(X,media,sigma)
[101] 9.684491e-05
>
>
> curve(dnorm(x,media,sigma),xlim=c(20,100),col="blue",lwd=2,
>
> # Especificamos el valor del que queremos saber su probabilidad, en este caso, 50:
> valor=50
> pnorm(valor,media,sigma)
[1] 0.07656373
>
> # Quiere decir que la probabilidad de que el rendimiento esté por debajo de 50 qq/Ha es
>
> valor=50
> # Para hallar la probabilidad de un valor mayor que 50, se resta 1 menos la probabilidad
>
> 1-pnorm(valor,media,sigma)
[1] 0.9234363
> # En este caso, la probabilidad de que el rendimiento esté por encima de 50 qq/Ha, es de
>
>
intervalo de 50 a 65 qq/Ha:
> valor1=50
> valor2=65
> VALOR1=pnorm(valor1,media,sigma)
> VALOR1
[1] 0.07656373
> VALOR2=pnorm(valor2,media,sigma)
> VALOR2
[1] 0.7624747
>
> VALOR2-VALOR1
[1] 0.685911
>
> # Se resta la probabilidad de que el rendimiento esté por debajo de 65 qq/Ha (p=0.762),
>
>
>
"sombra"
>
> curve(dnorm(x,media,sigma),xlim=c(20,100),col="blue",lwd=2,
>
> # DISTRIBUCION BINOMIAL
>
> n= 10 # Número total de ensayos realizados, en este caso son 10, que fueron el número
de semillas evaluadas
> p= 0.25 # La probabilidad de germinación de las semillas fue del 25 por ciento
>
siete semillas"
[1] 0.003089905
>
> # En este caso, se interpreta como la probabilidad de que germinen tres o más semillas
>
> k1=2 # Hay que calcular la probabilidad de un valor que sea una unidad menor que
[1] 0.5255928
>
> #Para conocer la probabilidad que germinen 3 o más semillas se resta 1 menos el
anterior resultado:
[1] 0.4744072
>
> k2=5
[1] 0.9802723
>
> E=n*p
>E
[1] 2.5
>
> V=n*p*(1-p)
>V
[1] 1.875
>
>
semillas\n(n=10,p=0.25)")
> #este gráfico muestra la probabilidad de ocurrencia de cada uno de los 11 eventos
> # En este caso, cuando p es menor que 0.5, la distribución se encuentra sesgada
>
>
>
página 105:
> # Supongamos que el número promedio de picaduras de gorgojo por semilla es 0.2 (es
[1] 0.1637462
>
> x0=0 # El valor de conteo que se quiere calcular la probabilidad, en este caso que
> x2=1
[1] 0.8187308
[1] 0.0175231
> # La probabilidad de que 2 de las 100 semillas tengan picaduras es de 0.0175 o del 1.8
por ciento