Está en la página 1de 23

300046_33

ESTADÍSTICA DESCRIPTIVA (PARA AGRARIAS)

ELABORADO POR:
MONICA DANIELA DIAZ
300046_33

PRESENTADO AL TUTOR:

 LUIS ALBERTO CACERES TORRES 

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)

JUNIO DE 2019
INTRODUCCIÓN
Objetivo general:

 Elaborar documento de aplicación de conceptos de probabilidad

Objetivos Específicos:

 Definir conceptos básicos de variables aleatorias y probabilidades y modelos


probabilísticos
 Implementar el programa R para obtener tablas de frecuencias relativas y
frecuencias relativas acumuladas
 Desarrollar ejercicios de los modelos probabilísticos en el programa R
DESARROLLO DEL TRABAJO

Defina:

Espacio muestral y con qué letra se denota: Es el conjunto de todos los valores que
potencialmente pueden asumir en un estudio aleatorio. Denotado con la letra griega
omega (Ω).

Punto muestral: Se denomina punto muestral a cada uno de los posibles resultados
de un estudio aleatorio, es decir a cada elemento de Ω
Evento muestral: Se llama evento a cualquier subconjunto de elementos de Ω

Explique en sus propias palabras el experimento aleatorio del dado deben descargar el
CODIGODADO disponible en la siguiente columna. El estudiante debe entender que,
aunque no es un experimento agropecuario nos ayuda a entender los conceptos
planteados.

Ejemplo del dado.

Teniendo en cuenta los conceptos anteriormente desarrollados hacemos una


comparación con el ejemplo de los dados, donde el conjunto de posibles resultados
arrojados cada vez que tiramos los dados hace parte del espacio muestral
representado por Ω. Los conjuntos de resultados obtenidos corresponden a un evento
muestral. En el caso del libro donde habla de dos eventos muestrales podemos
entender que el segundo evento donde habla de un seis y cualquier otro numero
diferente de seis, tiene una mayor probabilidad dado que las condiciones no son tan
cerradas con el primero donde solo pueden ser un par de seis.
Variable aleatoria: Función que asocia a cada elemento del espacio muestral Ω un
número real y luego a cada uno de estos valores le asignaremos probabilidades de
ocurrencia

¿Qué significa que el espacio muestral de una variable aleatoria continua es no


contable?

Quiere decir que como las variables continuas manejan rangos o intervalos, durante
este espacio puede salir un numero infinitos de resultados.

¿Que son variables aleatorias discretas proporcionales y que son variables


aleatorias discretas de conteo no acotado? De ejemplos este tipo de variables.

Las variables aleatorias discretas proporcionales son aquellas que no pueden superar
el número de elementos evaluados. Si se hace el estudio de las cajas de Petri con las
semillas, el resultado de semillas germinadas no podría ser mayor de 25, dado que ese
es el número de semillas que se pusieron en las cajas.

Variable aleatoria discreta de conteo no acotado, es simplemente el resultado de la


suma de un elemento en un espacio determinado. Por ejemplo el del libro que es el
número de pústulas de roya por m2 de cultivo

Existe dos conceptos de probabilidad el clásico y concepto frecuencial, defina


cada uno, en el caso del frecuencial explique el experimento de germinación de
una semilla cuál es el experimento aleatorio, cuál es el evento, cuantos puntos
muestrales tiene.

Concepto de probabilidad clásico, es cuando el espacio muestral es finito. Es el


estudiado en los juegos de azar.

Concepto frecuencial es una serie repetida de estudios aleatorios. Se usa cuando el


espacio muestral es infinito y no se pueden ennumerar todos los resultados posibles.

Ejemplo de la semilla

Experimento aleatorio Germinación de una semilla


Evento (A) Encontrar la semilla
Puntos muestrales 1000

Organizamos los datos en la formula asi:

¿ PUNTOS MUESTRALES FAVORABLES


P(A)=
¿ TOTAL DE PUNTOS MUESTRALES EN EL ESPACIO MUESTRAL

600
P(A)= = 0.6
1000

¿Qué diferencia existe entre el concepto de frecuencia relativa y el de


probabilidad?

Las frecuencias se entienden como probabilidades sólo cuando N tiende a infinito. Si el


número de veces que se repite un experimento no es grande, entonces hablaremos de
frecuencia relativa y diremos que ésta “aproxima” una probabilidad.
¿Que son eventos mutuamente excluyentes?, ¿cómo es la intersección de dos
eventos mutuamente excluyentes, si son excluyentes, dado un evento A y uno B,
a que es igual la P(A ꓴ B)?

Libro: Se dice que dos eventos son mutuamente excluyentes si cada uno está formado
por puntos muestrales distintos, es decir no existe ningún punto muestral en la
intersección de los subconjuntos que representan los eventos
Explicación: Son eventos mutualmente excluyentes aquellos que tienen puntos
muestrales distintos, es decir no tienen puntos muestrales en común. Al tener una
intersección igual a cero la probabilidad de la unión de esos eventos, P(AUB), es la
suma de las probabilidades de cada evento.
En el caso de distribuciones de variables aleatorias cuando una variable es
continua y simétrica que modelo se usa.

Para una variable continua y de distribución simétrica unimodal, es común el uso del
modelo Normal
¿Para una variable de conteo no acotado que modelo se utiliza?

Para conteos no acotados en el modelo Poisson.


¿Para variables de proporciones que modelo se utiliza?

Para proporciones se piensa en el modelo probabilístico Binomial

Que variables tienen función de probabilidad y que variables tienen función de


densidad.

La función de distribución de probabilidad de una variable aleatoria discreta


La función de densidad de una variable aleatoria continúa denotada como f(.)

¿Qué es la esperanza matemática de una variable aleatoria, como se denota?

La esperanza matemática de una variable aleatoria, usualmente denotada por E(.) o la


letra griega Mu (μ) es, desde un punto de vista intuitivo, un promedio de los valores
asumidos por la variable, donde cada valor es ponderado por su probabilidad de
ocurrencia.
¿Qué es la varianza de una variable aleatoria, como se denota?

La varianza de una variable aleatoria, denotada por Var(.) o la letra griega Sigma al
cuadrado, es una medida de dispersión. Su raíz cuadrada, denominada desvío
estándar () es usada para expresar la dispersión en término de diferencias (o desvíos)
de cada dato respecto a la esperanza.

Conceptos capítulo tres modelos probabilísticos:

DISTRIBUCION NORMAL

 Qué tipo de histograma se seleccionar un modelo probabilístico para una


variable aleatoria continua cuando se tienen datos de esa variable

Para una variable aleatoria continua cuando se tienen datos de esa variable, resulta
recomendable graficar un histograma de frecuencias relativas y observar la forma del
mismo
 Que es la estandarización, cuál es su fórmula.
La estandarización nos permite llevar cualquier distribución normal a la
distribución normal estándar. La transformación, estandarización, tiene la
siguiente forma:

Donde:
Y: es el valor de la variable aleatoria que define el evento de interés
µ y σ2 son la media y la varianza de la distribución de Y.

DISTRIBUCIÓN BINOMIAL

 Qué tipo de conteos se trabajan con la distribución Binomial


Puede usarse para el cálculo de probabilidades de eventos provenientes de
conteos acotados.
 En la distribución binomial que es n y que es P
Se supone que se realizan cierto número (n) de experimentos aleatorios y en
cada experimento se registra uno de dos resultados posibles, éxito o fracaso
donde el éxito tiene una cierta probabilidad (P) de ocurrencia
 A que es igual la esperanza y la varianza en esta distribución.

DISTRIBUCION DE POISSON

 Que tipos de conteos se trabaja con la distribución de Poisson.

Sirve como modelo probabilístico para variables discretas de tipo conteo. En el


caso de la Poisson, los conteos se refieren al número de veces que un evento
ocurre en una unidad de tiempo o espacio dada. Los valores de Y en Poisson
pueden pertenecer a los naturales entre 0 e infinito.

 En agronomía se usa para que tipo de conteos, les recuerdo los ácaros por
ejemplo se pueden trabajar con esta distribución.
En Agronomía, la distribución Poisson suele usarse para modelar el número de
insectos sobre una planta, o en un golpe de red, el número de manchas
defectuosas en un mosaico, o en un metro cuadrado de piso, el número de
colémbolos en 100 g de suelo, o en 1000 cm3 de suelo o el número de
coliformes en 1 ml de agua, entre otros conteos de interés.

 Como se denota el único parámetro de esta distribución, a que es igual la media


y la varianza.
El único parámetro de la distribución Poisson es λ. La propiedad de esperanza
igual a varianza de la distribución Poisson implica que al aumentar el promedio
de los conteos, aumenta también su varianza. La varianza de una Poisson es
función de la media.
 Revisando el ejercicio de la table 3.1 del libro de Balzarini como se obtiene λ en
este caso a que es igual la media y la varianza.
El ejemplo del libro nos muestra la siguiente tabla:

De las 50 muestras que el comerciante extrajo, cada una de 1 kilo se obtiene la tabla
anterior. Calculamos entonces λ de la siguiente manera:

λ = [(10x3)+(20x6)+(30x10)+(40x20)+(50x6)+(60x5)]/50 = 870/50 = 37

Identificamos cuantas muestras de 1 kilo, tiene la cantidad de granos partidos que se


muestran. Es decir que se esperan 37 granos partidos por kilo.

La desviación estándar es la raíz cuadrada de la varianza:

√ λ = √ 37 = 6,08

EN EL CAPITULO 2 EN EL EJERCICIO APLICACIÓN Y PAGINAS SIGUIENTES

 Estudie el ejercicio de velocidad del viento de la del texto y explicar por qué
hay un sitio mejor para el objeto del estudio, pueden tomar pantallazos del
gráfico.
SUR NORTE

El libro nos suministra unos datos que son de relevancia:


o Un molino de viento que genera energía empieza a funcionar cuando
el viento alcanza los 19km/h
o Un molino de viento alcanza su máximo rendimiento con vientos entre
los 40 y 48 km/h
o Un molino con fines de extracción de agua subterránea debe esperar
una velocidad de vientos promedio de 26km/h.

En las imágenes están las gráficas de dos zonas: Norte y Sur.

Analizando la información arrojada por las gráficas podemos concluir que la


zona norte es la que mejor se adapta para los molinos de extracción de agua,
dadas las velocidades de viento que se presentan en esta zona que son en
promedio 46km/h.

EJERCICIOS:

Desarrolle el ejercicio 2.1 del texto de Balzarini y en el caso del punto e revise la
presentación de probabilidad en R. En este caso se requiere obtener la tabla de
frecuencias relativas f(y) y la tabla de frecuencias relativas acumuladas que es la
misma F(Y), este ejercicio se puede desarrollar en una tabla de Word.

Ejercicio 2.1: Supongamos que se toma una muestra aleatoria con reposición de
tamaño n=2 a partir del conjunto {1,2,3} y se produce el siguiente espacio muestral con
9 puntos muestrales:
Ω={(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)}

Supongamos además que definimos la variable aleatoria Y=suma de los dos números,
que conforma un nuevo espacio probabilístico y que estamos interesados en los
siguientes eventos:
El evento A conformado por los puntos muestrales cuya suma sea un número par, es
decir, A={(1,1),(1,3),(2,2),(3,1),(3,3)} y P(A)= 5/9.

El evento B conformado por los puntos muestrales cuya suma sea un número impar,
siendo B={(1,2),(2,1),(2,3),(3,2)} y P(B)=4/9.
El evento C conformado por los elementos cuya suma es 5.
C={(2,3)(3,2)} Y P(C)=2/9

Preguntas:

a) ¿Qué tipo de concepto de probabilidad aplicaría para calcular probabilidades?


Concepto de probabilidad clásico dado que conocemos todo el espacio muestral.
Es decir es finito
b) Los eventos A y B, ¿son independientes?
Son independientes porque el resultado de A no afecta a B
c) ¿Cuál es la probabilidad de que ocurra A o B?

Podemos guiarnos con la siguiente expresión:

Teoría de los dados: Dados los eventos A y B, la probabilidad de que ocurra A o B es


dada por P(AUB) = P(A) + P(B) - P(A ∩ B), donde P(AUB) denota la probabilidad de
que ocurran A y B simultáneamente y P(A ∩ B)=0

P(A U B) = P(A) + P(B) Donde P(A) = 5/9 y P(B)= 4/9


P(A U B)= 9/9 = 1 es decir 100%

d) ¿Cuál es la probabilidad de que ocurra B o C?

P(B U C)= P(B) + P(C) Donde P(B)=5/9 y P(C) = 2/9


P(B U C)= 4/9 + 2/9 = 7/9 =0,77 Es decir 77%

e) Representar tabularmente a F(Y).


El mínimo valor que se puede obtener es 2, entonces:

2 F(2)= 1/9 F(2)= F(2)= 1/9


3 F(3)= 2/9 F(3)= F(2) + F(3) = 3/9
4 F(4)= 3/9 F(4)= F(2) + F(3) + F(4) = 6/9
5 F(5)= 2/9 F(5)= F(2) + F(3) + F(4) +F(5)= 8/9
6 F(6)=1/9 F(6)= F(2) + F(3) + F(4) +F(5)+F(6)=9/9

Valor a Frec. Frec. % Frec.


obtener Absoluta Relativa Absoluta
acumulada
2 1 1/9=0.111 11.1% 1
3 2 2/9=0.222 22.2% 3
4 3 3/9=0.333 33.3% 6
5 2 2/9=0.22 22.2% 8
6 1 1/9=0.111 11.1% 9

Por lo tanto la distribución ƒ de X es la siguiente:

X 2 3 4 5 6
ƒ(y) 1/9 3/9 6/9 8/9 1

Ejercicio 2.3: Los siguientes datos corresponden a la venta de tractores que registra
una empresa de maquinarias agrícolas en los días laborables del último año:
Tractores Cantidad de
vendidos días
0 110
1 80
2 35
3 25
4 10
Total 260

Preguntas:

¿Cuál es la variable en estudio?

Cantidad de tractores vendidos por día

¿Cuántos resultados posibles tiene la variable? ¿Qué tipo de variable es?

La variable tiene 5 posibles resultados. La variable es de tipo discreta

¿Cuál es la probabilidad de que hoy no venda ningún tractor?

P(A)=110/260= 0,42 es decir 42%

¿Cuál es la probabilidad que un día, seleccionado al azar dentro de los días laborables
del año, venda 3 o más tractores?

P(A)=P(x=3)+P(x=4 o más)=25/260+10/260=35/260= 0,1346 es decir 13,46%

¿Cuál es la probabilidad que en los próximos dos días venda 3 tractores?

P(A=vender 3 tractores mañana y vender 3 tractores pasado


mañana)=(25/260)×(24/260)

TRABAJO CON VARIABLES DE CIENCIAS AGRARIAS

El estudiante debe descargar en su carpeta de trabajo el archivo Excel


PROBABILIDAD.csv y el código CODIGOPROBABILIDAD, debe verificar lectura de la
carpeta y correr el respectivo código. En este caso el código explica como seleccionar
las variables y el programa las lee del archivo PROBABILIDAD Cada estudiante debe
correr el modelo para una variable discreta y una continua dando conclusiones de lo
encontrado acorde a su profesión. ¿cuál es conteo de más alta probabilidad? En el
caso de la variable continua el 50% de los datos de su variables serán menores ó
iguales a que a valor?

Variable seleccionada: Hogares 3

El conteo de más alta probabilidad son varios:

8 6

13 6

20 6

21 6

23 6

30 6
En el caso de la variable continua el 50% de los datos de su variables serán menores ó
iguales a que a valor?
100
80
60
Frequency

40
20
0

8.91 11.46 16.55 21.65 26.74

Class limits

En este punto se pretende que el estudiante aprenda a aplicar modelos probabilísticos


debe revisar en el capítulo tres modelos probabilísticos, en este los ejercicios de
aplicación de los modelos normal, binomial y Poisson, para lo cuál el estudiante debe
descargar el código MODELOS y ubicarlo en la carpeta estadística descriptiva, para
correrlo desde el programa R.
MODELO NORMAL

TEXTO DEL LIBRO

MEDIA: 25 VARIANZA:9 MEDIA2:30


Función de Distribución N(MEDIA.MEDIA2 EN ROJO,MISMA VARIANZA)

0.12
0.12

0.10
0.10

dnorm(x, MEDIA2, SIGMA)

0.08
0.08
F(x)

0.06
0.06

0.04
0.04

0.02
0.02

0.00
0.00

10 15 20 25 30 35 40 10 15 20 25 30 35 40

x x

Función de Distribución N(VARIANZA.VARIANZA1 EN ROJO,MISMA MEDIA)


0.4

0.25
dnorm(x, MEDIA, SIGMA1)
0.3

0.20
0.15
F(x)

0.2

0.10
0.1

0.05
0.00
0.0

10 15 20 25 30 35 40
10 15 20 25 30 35 40
x
x

Gráfica de la función de densidad con una media de 28 y 23 ambas con una varianza
de 10 misma varianza en ambos casos.
Función de Distribución N(MEDIA.MEDIA2 EN ROJO,MISMA VARIANZA)

0.12
0.12

0.10
0.10

dnorm(x, MEDIA2, SIGMA)

0.08
0.08
F(x)

0.06
0.06

0.04
0.04

0.02
0.02

0.00
0.00

10 15 20 25 30 35 40
10 15 20 25 30 35 40
x
x

Función de Distribución N(MEDIA.MEDIA2 EN ROJO,MISMA VARIANZA)


0.12
0.10
0.08
F(x)

0.06
0.04
0.02
0.00

10 15 20 25 30 35 40

Como podemos observar, al cambiar la media y conservar la varianza, las gráficas se


desfasan en el eje de las x.

Hacer el ejercicio con una media de 32 y dos varianzas una de 10 y otra de 8, es el


caso de la misma media y dos varianzas, que pasa cuando se cambia le media y hay la
misma varianza, hacia donde se desplaza la figura y que pasa cuando se cambia la
varianza en que se afecta la figura.
Función de Distribución N(VARIANZA.VARIANZA1 EN ROJO,MISMA MEDIA)
0.4

0.14
0.12
0.3

dnorm(x, MEDIA, SIGMA1)

0.10
0.08
F(x)

0.2

0.06
0.04
0.1

0.02
0.0

0.00
10 15 20 25 30 35 40
10 15 20 25 30 35 40
x
x

Función de Distribución N(VARIANZA.VARIANZA1 EN ROJO,MISMA MEDIA)


0.4
0.3
F(x)

0.2
0.1
0.0

10 15 20 25 30 35 40

Cuando conservamos la media y modificamos la varianza observamos que las gráficas


dejan de coincidir en la altura.

#EJERCICIO DE HIBRIDO MAIZ


Función de Distribución N(media.sigma)
0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

#PROBABILIDAD DE UN VALOR MENOR O IGUAL

> pnorm(valor,media,sigma)

[1] 0.4432015

#PROBABILIDAD DE UN VALOR MAYOR

1-pnorm(valo,media,sigma)

[1] 0.8413447

##PROBABILIDAD EN UN RANGO DE VALORES

Función de Distribución N(media.sigma)


0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

MODELO BINOMIAL
Datos del libro

CON AYUDA DEL CÓDIGO determinar la probabilidad de germinar 5 semillas, por lo


menos cuatro y a lo sumo 4.
MODELO POISSON
El estudiante debe revisar del texto el ejercicio de las picaduras del Gorgojo, correr el
código MODELOS que está con los datos del texto, y adicionalmente determinar
cuantas de 100 semillas tendrán 3 picaduras y cuantas 6 o más, en este caso saque
las probabilidades de 0,1,2,3,4,5 las suma y se las resta a uno.

También podría gustarte