Está en la página 1de 27

300046_4

ESTADÍSTICA DESCRIPTIVA (PARA AGRARIAS)

ELABORADO POR:
CRISTIAN CAMILO ALONSO
300046_4

PRESENTADO AL TUTOR:

LUIS ALBERTO CACERES TORRES

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)

JULIO DE 2019
INTRODUCCIÓN

Como solución a muchas situaciones de incertidumbre que se presentan en el área de


la Agronomía, nace el estudio de los modelos probabilísticos y las variables aleatorias,
para poder procesar la información con herramientas tecnológicas como el programa R,
que nos permita obtener de manera sencilla y ágil resultados a determinadas situaciones
y prediciendo correctamente los posibles resultados para la toma de decisiones.
Objetivo general:

 Aplicar conceptos de probabilidad a través de ejercicios prácticos y el programa R

Objetivos Específicos:

 Determinar conceptos de variables aleatorias y modelos probabilísticos para su


puesta en practica
 Interpretar los resultados obtenidos por el programa R
 como resultado a la información suministrada
 Desarrollar los ejercicios de modelos probabilísticos del programa R para el
procesamiento de la información
Tema: variables aleatorias y probabilidades

 Espacio muestral y con qué letra se denota


R/ El espacio muestral es el conjunto de todos los valores que
potencialmente pueden asumir en un estudio aleatorio. Tal conjunto de
resultados posibles y es usualmente denotado con la letra griega omega
(Ω).

 Punto muestral.
R/ Se denomina punto muestral a cada uno de los posibles resultados de
un estudio aleatorio, es decir a cada elemento de (Ω).

 Evento muestral.
R/ Se llama evento a cualquier subconjunto de elementos de (Ω) Por
ejemplo, supongamos un experimento aleatorio donde se tiran dos dados
y se registran los resultados de cada dado. Todos los pares de números
del 1 al 6 conforman el espacio muestral. Un evento de (Ω), puede ser “que
salga un seis en un dado y un seis en el segundo dado”; otro evento puede
ser “que salga un seis en un dado y cualquier otro número distinto de seis
en el otro dado”.

 Explique en sus propias palabras el experimento aleatorio del dado deben


descargar el CODIGODADO disponible en la siguiente columna. El
estudiante debe entender que, aunque no es un experimento agropecuario
nos ayuda a entender los conceptos planteados.
R/ Lo primero que observamos es el espacio muestran donde se visualizan
todas las posibles combinaciones que tenemos al lanzar los dos dados:
(1,1),(1,2),(1,3),(1,4),(1,5),(1,6)…
De acuerdo a las condiciones que nos muestra el ejercicio podemos
predecir que la probabilidad de obtener un resultado como un seis y
cualquier otro número, es mal alta comparada con combinación de (6,6),
dado que las posibles combinaciones para obtener la primera combinación
con 6, por el contrario de la combinación (6,6) es solo una.
 Defina Variable aleatoria
R/ Pueden ser interpretadas como funciones usadas para describir los
resultados de un estudio aleatorio. Para el propósito del análisis de datos
las clasificamos en cuantitativas y cualitativas

 ¿Qué significa que el espacio muestral de una variable aleatoria continua


es no contable?,¿que son variables aleatorias discretas proporcionales y
que son variables aleatorias discretas de conteo no acotado? De ejemplos
este tipo de variables.
R/ ¿Qué significa que el espacio muestral de una variable aleatoria
continua es no contable? Una variable aleatoria de tipo continua es no
contable, queriendo significar que, entre dos valores de la variable, pueden
realizarse un número infinito de otros valores. Además, si el espacio
muestral es continuo, la diferencia entre valores de la variable está definida
aritméticamente.
¿que son variables aleatorias discretas proporcionales y que son variables
aleatorias discretas de conteo no acotado? La variable aleatorias discretas
proporcionales es aquella que sólo puede tomar un número finito de valores
dentro de un intervalo y las variables aleatorias discretas de conteo no
acotado se puede tomar los infinitos valores de los números naturales. Por
ser un conjunto numerable, es una variable discreta

Ejemplo de discreta proporcional, las veces que ha llovido en la ciudad este


mes solo puede ser un valor igual o mayor a 0 y entero

Ejemplo de no acotada es la cantidad de espermatozoides en una muestra


de semen, por cuanto se tratará de un valor discreto de tipo aleatorio y sin
límites precisos.

 Existe dos conceptos de probabilidad el clásico y concepto frecuencial,


defina cada uno, en el caso del frecuencial explique el experimento de
germinación de una semilla cuál es el experimento aleatorio, cuál es el
evento, cuantos puntos muestrales tiene.

R/ concepto de probabilidad clásica: Cuando (Ω) es finito (el número de


puntos muestrales es contable) se puede dar una definición de probabilidad
que se basa en la observación de los elementos del espacio muestral
Concepto de probabilidad frecuencial: Se refiere a una serie repetida de
estudios aleatorios. Generalmente se usa cuando el espacio muestral es
infinito y por tanto no se pueden enumerar todos los resultados posibles del
estudio
Ejemplo: La semilla
Evento (A): semilla germinada
Muestras: 1000
P(A)= (Puntos muestrales favorables) / (Total puntos muestrales en el
espacio muestral )
P(A)= 600/1000 = 0,6
 ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de
probabilidad?
R/ Las frecuencias se entienden como probabilidades sólo cuando N tiende
a infinito. Si el número de veces que se repite un experimento no es grande,
entonces hablaremos de frecuencia relativa y diremos que ésta “aproxima”
una probabilidad

 ¿Que son eventos mutuamente excluyentes?, ¿cómo es la intersección de


dos eventos mutuamente excluyentes, si son excluyentes, dado un evento
A y uno B, a que es igual la P(AꓴB)?
R/ Se dice que dos eventos son mutuamente excluyentes si cada uno está
formado por puntos muestrales distintos, es decir no existe ningún punto
muestral en la intersección de los subconjuntos que representan los
eventos y , por la teoría de conjuntos, se tiene
Si A y B son dos eventos de (Ω)., la unión de eventos conforma un nuevo
conjunto, que contiene a los puntos muestrales de A y de B
La unión de A y B se denota por AUB.

 En el caso de distribuciones de variables aleatorias cuando una variable es


continua y simétrica que modelo se usa.
R/ se una el modelo normal

 ¿Para una variable de conteo no acotado que modelo se utiliza?


R/ para el conteo no acotado se unas el modelo poisson

 ¿Para variables de proporciones que modelo se utiliza?


R/ En variables de proporciones se piensa en el modelo probabilístico
Binomial

 Que variables tienen función de probabilidad y que variables tienen función


de densidad.
R/ se tiene la distribución acumulada F(.), que designa una probabilidad de
ocurrencia para valores menores o iguales a un valor de la variable y las
funciones de densidad permite asignar probabilidades a eventos definidos
en términos de intervalos. Así, en las variables continuas se podrá conocer
la probabilidad de que la variable asuma un valor entre “tanto” y “tanto”,
mayor a “tanto” o menor a “tanto”, pero no exactamente igual a un valor
determinado (esta última probabilidad por definición es cero)

 Cuáles son los parámetros más usados en estadística para estudiar y


utilizar funciones de distribución de variables aleatorias.

R/
 Esperanza matemática para una variable aleatoria discreta
 Esperanza matemática para una variable aleatoria continua
 Varianza de una variable aleatoria
 Covarianza
 ¿Qué es la esperanza matemática de una variable aleatoria, como se
denota?
R/ La esperanza matemática de una variable aleatoria, usualmente
denotada por E(.) o la letra griega Mu (µ) es, desde un punto de vista
intuitivo, un promedio de los valores
asumidos por la variable, donde cada valor es ponderado por su
probabilidad de ocurrencia

 ¿Qué es la varianza de una variable aleatoria, como se denota?


R/ denotada por Var(.) o la letra griega Sigma al cuadrado (σ²), es una
medida de dispersión. Su raíz cuadrada, denominada desvío estándar (σ)
es usada para expresar la dispersión en término de diferencias (o desvíos)
de cada dato respecto a la esperanza.

Conceptos capítulo tres modelos probabilísticos

DISTRIBUCION NORMAL

 Qué tipo de histograma se seleccionar un modelo probabilístico para una variable


aleatoria continua cuando se tienen datos de esa variable
R/ histograma de frecuencias relativas y observar la forma del mismo, ya que
podemos usar Chi-Cuadrado, Normal, Exponencial y Uniforme.

 Que es la estandarización, cuál es su fórmula.


R/ nos permite llevar cualquier distribución normal a la distribución normal
estándar. La transformación, estandarización, tiene la siguiente forma:

donde Y es el valor de la variable aleatoria que define el evento de interés,


µ y σ2 son la media y la varianza de la distribución de Y. La nueva variable aleatoria
Z, obtenida mediante estandarización de Y, se distribuye normal con media cero
y varianza uno, es decir, normal estándar

DISTRIBUCIÓN BINOMIAL

 Qué tipo de conteos se trabajan con la distribución Binomial


R/ La distribución Binomial puede usarse para el cálculo de probabilidades de
eventos provenientes de conteos acotados

 En la distribución binomial que es n y que es P.


R/ (n) Número
(p) Probabilidad

 A que es igual la esperanza y la varianza en esta distribución.


R/ Es la manera de determinar qué porcentaje de probabilidad tiene cierto dato de
salir en un determinado número de ensayos y a subes la variabilidad que este
presenta

DISTRIBUCION DE POISSON

 Que tipos de conteos se trabaja con la distribución de Poisson.


R/ La distribución Poisson facilita el cálculo de probabilidades de variables
aleatorias que provienen de conteos no acotados

 Como se denota el único parámetro de esta distribución, a que es igual la media


y la varianza.
R/ La propiedad de esperanza igual a varianza de la distribución Poisson implica
que al aumentar el promedio de los conteos, aumenta también su varianza. La
varianza de una Poisson es función de la media.
 Revisando el ejercicio de la table 3.1 del libro de Balzarini como se obtiene λ en
este caso a que es igual la media y la varianza.
R/ el parámetro λ de esta distribución Poisson, que se calcula de la siguiente
manera: λ = [(10 × 3) +(20 × 6) +(30 × 10) +(40 × 20) +(50 × 6) +(60 × 5)]/50 =
870/50 = 37
Es decir, en promedio se esperan 37 granos partidos por kilogramo de arroz. Una
vez estimado el parámetro λ, podemos calcular probabilidades de ocurrencia de
eventos bajo una distribución Poisson
Valor 1 indica 1 DE por encima de la media y el valor -1.7 corresponde a 1.7 DE
por debajo de la media.

La desviación estándar es la raíz cuadrada de la varianza:

√λ = √37 = 6,08

CAPITULO 2
Estudie el ejercicio de velocidad del viento de la del texto y explicar por qué hay un sitio
mejor para el objeto del estudio, pueden tomar pantallazos del gráfico.
R/ Las condiciones que nos da el ejercicio son las siguientes:
 Cuando el viento alcanza los 19km/h el molino de viento empieza a funcionar y
genera energía
 Cuando el viento alcanza las velocidades de entre 40 y 48km/h alcanza su máximo
rendimiento
 Para poder hacer extracción de aguas subterráneas se debe esperar una
velocidad de vientos aproximadamente de 26km/h.
SUR

NORTE

En las imágenes están las gráficas de dos zonas: Norte y Sur.

Analizando la información arrojada por las gráficas podemos concluir que la zona norte
es la que mejor se adapta para los molinos de extracción de agua, dadas las velocidades
de viento que se presentan en esta zona que son en promedio 46km/h.

EJERCICIOS:

Ejercicio 2.1: Supongamos que se toma una muestra aleatoria con reposición de tamaño
n=2 a partir del conjunto {1,2,3} y se produce el siguiente espacio muestral con 9 puntos
muestrales:

Ω={(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)}

Supongamos además que definimos la variable aleatoria Y=suma de los dos números,
que conforma un nuevo espacio probabilístico y que estamos interesados en los
siguientes eventos:
El evento A conformado por los puntos muestrales cuya suma sea un número par, es
decir, A={(1,1),(1,3),(2,2),(3,1),(3,3)} y P(A)= 5/9.

El evento B conformado por los puntos muestrales cuya suma sea un número impar,
siendo B={(1,2),(2,1),(2,3),(3,2)} y P(B)=4/9.
El evento C conformado por los elementos cuya suma es 5.

Preguntas:

a) ¿Qué tipo de concepto de probabilidad aplicaría para calcular probabilidades?


Como el ejercicios nos da todo el espacio muestral es un Concepto de
probabilidad clásico
b) Los eventos A y B, ¿son independientes?
Como el resultado de A no afecta a B, son independientes.
c) ¿Cuál es la probabilidad de que ocurra A o B?
Podemos guiarnos con la siguiente expresión:

Teoría de los dados: Dados los eventos A y B, la probabilidad de que ocurra A o B es


dada por P(AUB) = P(A) + P(B) - P(A ∩ B), donde P(AUB) denota la probabilidad de
que ocurran A y B simultáneamente y P(A ∩ B)=0

P(A U B) = P(A) + P(B) Donde P(A) = 5/9 y P(B)= 4/9


P(A U B)= 9/9 = 1 o 100%

d) ¿Cuál es la probabilidad de que ocurra B o C?

P(B U C)= P(B) + P(C) Donde P(B)=5/9 y P(C) = 2/9


P(B U C)= 4/9 + 2/9 = 7/9 =0,77 Es decir 77%
e) Representar tabularmente a F(Y).
El mínimo valor que se puede obtener es 2, entonces:

2 F(2)= 1/9 F(2)= F(2)= 1/9


3 F(3)= 2/9 F(3)= F(2) + F(3) = 3/9
4 F(4)= 3/9 F(4)= F(2) + F(3) + F(4) = 6/9
5 F(5)= 2/9 F(5)= F(2) + F(3) + F(4) +F(5)= 8/9
6 F(6)=1/9 F(6)= F(2) + F(3) + F(4) +F(5)+F(6)=9/9

Valor a Frec. Frec. Relativa % Frec.


obtener Absoluta Absoluta
acumulada
2 1 1/9=0.111 11.1% 1
3 2 2/9=0.222 22.2% 3
4 3 3/9=0.333 33.3% 6
5 2 2/9=0.22 22.2% 8
6 1 1/9=0.111 11.1% 9

Ejercicio 2.3: Los siguientes datos corresponden a la venta de tractores que registra una
empresa de maquinarias agrícolas en los días laborables del último año:
Tractores Cantidad de
vendidos días
0 110
1 80
2 35
3 25
4 10
Total 260
Preguntas:

¿Cuál es la variable en estudio?

Numero de tractores vendidos por día

¿Cuántos resultados posibles tiene la variable? ¿Qué tipo de variable es?

5 posibles resultados para la variable. La variable discreta

¿Cuál es la probabilidad de que hoy no venda ningún tractor?

P(A)=110/260= 0,42 o 42%

¿Cuál es la probabilidad que un día, seleccionado al azar dentro de los días laborables
del año, venda 3 o más tractores?

P(A)=P(x=3)+P(x=4 o más)=25/260+10/260=35/260= 0,1346 o 13,46%

¿Cuál es la probabilidad que en los próximos dos días venda 3 tractores?

P(A)= (Vender 3 tractores mañana y vender 3 tractores pasado mañana) =


(25/260)×(24/260)

TRABAJO CON VARIABLES DE CIENCIAS AGRARIAS

El estudiante debe descargar en su carpeta de trabajo el archivo Excel


PROBABILIDAD.csv y el código CODIGOPROBABILIDAD, debe verificar lectura de la
carpeta y correr el respectivo código. En este caso el código explica como seleccionar
las variables y el programa las lee del archivo PROBABILIDAD Cada estudiante debe
correr el modelo para una variable discreta y una continúa dando conclusiones de lo
encontrado acorde a su profesión. ¿cuál es conteo de más alta probabilidad? En el caso
de la variable continua el 50% de los datos de su variable serán menores ó iguales a que
a valor?

Variable seleccionada: HOGARES8


De acuerdo a las indicaciones del ejercicio por la carrera que es Ing Ambiental la
variables es Hogares y por ser grupo 4, la variable debe ser par.

> min(CONTEO)
[1] 5
> max(CONTEO)
[1] 30

Tablas de frecuencia
El conteo de más alta probabilidad son varios:

5 6

6/30 = 0,2 o 20%

Gráfico de barras CONTEO FRECUENCIAS RELATIVAS ACUMULADAS CONTEO

1.0
7
6

0.8
5
Frecuencias absolutas

Frecuencias relativas

0.6
4
3

0.4
2

0.2
1

0.0
0

5 7 9 11 13 15 17 19 21 23 25 27 29 5 7 9 11 13 15 17 19 21 23 25 27 29

En el caso de la variable continua el 50% de los datos de sus variables serán menores ó
iguales a que a valor?
Instalación de paquete “fdth”

Variable seleccionada PM8

20
15
Frequency

10
5
0

8.91 11.58 16.93 22.28 27.63

Class limits

Histograma de barras
100
80
60
Frequency

40
20
0

8.91 11.58 16.93 22.28 27.63

Class limits

Donde se une las lineas rojos es la mediana PODEMOS DECIR QUE EL 50%
MATERIAL PARTICULADO PUEDEN TENER VALORES #IGUALES MENORES
AL VALOR DE LA MEDIANA QUE EN ESTE CASO ES 20.1

En este punto se pretende que el estudiante aprenda a aplicar modelos probabilísticos


debe revisar en el capítulo tres modelos probabilísticos, en este los ejercicios de
aplicación de los modelos normal, binomial y Poisson, para lo cuál el estudiante debe
descargar el código MODELOS y ubicarlo en la carpeta estadística descriptiva, para
correrlo desde el programa R.
MODELO NORMAL

TEXTO DEL LIBRO

Datos: media: 25 varianza:9 media2:30

Media 25 Varianza 9 Media2 30

Función de Distribución N(MEDIA.MEDIA2 EN ROJO,MISMA VARIANZA)

0.12
0.12

0.10
0.10

dnorm(x, MEDIA2, SIGMA)

0.08
0.08
F(x)

0.06
0.06

0.04
0.04

0.02
0.02

0.00
0.00

10 15 20 25 30 35 40
10 15 20 25 30 35 40
x
x

Función de Distribución N(VARIANZA.VARIANZA1 EN ROJO,MISMA MEDIA)


0.4

0.25
0.3

dnorm(x, MEDIA, SIGMA1)

0.20
F(x)

0.15
0.2

0.10
0.1

0.05
0.0

0.00

10 15 20 25 30 35 40
10 15 20 25 30 35 40
x
x
 Gráfica de la función de densidad con una media de 28 y 23 ambas con una
varianza de 10 misma varianza.

Función de Distribución N(MEDIA.MEDIA2 EN ROJO,MISMA VARIANZA)


0.12

0.12
0.10

0.10
dnorm(x, MEDIA2, SIGMA)
0.08

0.08
F(x)

0.06

0.06
0.04

0.04
0.02

0.02
0.00

0.00
10 15 20 25 30 35 40 10 15 20 25 30 35 40

x x

Función de Distribución N(MEDIA.MEDIA2 EN ROJO,MISMA VARIANZA)


0.12
0.10
0.08
F(x)

0.06
0.04
0.02
0.00

10 15 20 25 30 35 40

x
Hacer el ejercicio con una media de 32 y dos varianzas una de 10 y otra de 8, es el caso
de la misma media y dos varianzas, que pasa cuando se cambia le media y hay la misma
varianza, hacia donde se desplaza la figura y que pasa cuando se cambia la varianza en
que se afecta la figura.

Función de Distribución N(VARIANZA.VARIANZA1 EN ROJO,MISMA MEDIA)


0.4

0.14
0.12
0.3

dnorm(x, MEDIA, SIGMA1)

0.10
0.08
F(x)

0.2

0.06
0.04
0.1

0.02
0.0

0.00
10 15 20 25 30 35 40
10 15 20 25 30 35 40
x
x

Función de Distribución N(VARIANZA.VARIANZA1 EN ROJO,MISMA MEDIA)


0.4
0.3
F(x)

0.2
0.1
0.0

10 15 20 25 30 35 40

Cuando conservamos la media y modificamos la varianza observamos que las gráficas


dejan de coincidir en la altura.
HIBRIDO MAIZ

Función de Distribución N(media.sigma)


0.05
0.04

#PROBABILIDAD DE UN VALOR MENOR O IGUAL


0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

Función de Distribución N(media.sigma)


0.05
0.04
0.03
F(x)

0.02
0.01
0.00

20 40 60 80 100

x
MODELO BINOMIAL
Ejercicio con los datos proporcionados por el libro

CON AYUDA DEL CÓDIGO determinar la probabilidad de germinar 5 semillas, por lo


menos cuatro y a lo sumo 4.
MODELO POISSON
El estudiante debe revisar del texto el ejercicio de las picaduras del Gorgojo, correr el
código MODELOS que está con los datos del texto, y adicionalmente determinar cuantas
de 100 semillas tendrán 3 picaduras y cuantas 6 o más, en este caso saque las
probabilidades de 0,1,2,3,4,5 las suma y se las resta a uno.
CONCLUSIONES

El estudio de variables y modelos probabilísticos desarrollado en este trabajo, sirve para


poder presentar información precisa y verídica. De la mano del programa R nos permite
poder procesar información de manera más ágil y rápida para realizar presentaciones
con un grado alto de calidad.

El hecho de poder predecir los acontecimientos que van a suceder nos permite poder
tomar decisiones, y medir sucesos o calidad de los productos.
BIBLIOGRAFIA

 Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en


problemas de agronomía. Recuperado de
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?docID=322177
5&query=bioestadistica

También podría gustarte