Actividad 3 Estadistica N (2

ESTADÍSTICA DESCRIPTIVA
TAREA 3 Distribución y probabilidad

PRESENTADO POR:
MARLY YULIANA HERRERA

CC.:
LILIAM JAIDY VARGAS ABAUNZA
CC.: 1099546511
CAMILA FERNANDA MALDONADO CASTAÑEDA

CC.:1077920854
LISBETH JOHANNA PINILLA OSORIO
CC.:
GRUPO: 300046_16
PARA:
CAMILO ANDRÉS CÁRDENAS
TUTOR
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS AGRÍCOLAS, PECUARIAS Y DEL MEDIO AMBIENTE

INTRODUCCIÓN
Atreves de esta actividad veremos formulaciones y conceptos de varias variables

estadísticas, las cuales son de gran importancia para poder estudiar eventos y
circunstancias que proceden en los diferentes resultados.
La probabilidad de ocurrencia de un evento determinado prominente de la observación
de una característica, y atraves de un abordaje del concepto del curso de estadística
descriptiva.
Normalmente la información dada en un proceso de observación es tratada en un
primer momento, esto con el objetivo de resumir y describir las características más
sobresalientes y generalmente se basa en el uso de gráficos y tablas. Y en la
obtención de medidas resumen el objetivo de esta actividad es de reconocer las
diferentes variables relevantes mediante un proceso de observación o
experimentación, caracterizar y descubrir muestras de las poblaciones mediante las
medidas de resumen tablas frecuencias y representaciones graficas
1. Revisar el OVI y los Contenidos y referentes bibliográficos de la Unidad 2,
ubicados en el Entorno de Aprendizaje y explicar en sus propias palabras los
siguientes términos:
a. Espacio muestral, con qué letra se denota.
b. Punto muestral.
c. Evento muestral.
d. Variable aleatoria
e. ¿Qué significa que el espacio muestral de una variable aleatoria continua es
no contable?
f. ¿Qué son variables aleatorias discretas proporcionales y que son variables
aleatorias discretas de conteo no acotado? De ejemplos de este tipo de
variables.
g. Existen dos conceptos de probabilidad: el clásico y el concepto frecuencial;
defina cada uno
H. En el caso de la probabilidad frecuencial, explique el experimento de
germinación de una semilla, cuál es el experimento aleatorio, cuál es el evento y
cuantos puntos muestrales tiene.
i. ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de
probabilidad?
j. ¿Qué son eventos mutuamente excluyentes? ¿Cómo es la intersección de dos
eventos mutuamente excluyentes? ¿Si son excluyentes, dado un evento A y uno
B, a que es igual la P(A ꓴ B)?
k. En el caso de distribuciones de variables aleatorias, si una variable es
continua y simétrica, ¿qué modelo se usa?
l. Para una variable de conteo no acotado, ¿qué modelo se utiliza?
m. Para variables de proporciones ¿qué modelo se utiliza?
n. ¿Qué variables tienen función de probabilidad y cuáles variables tienen
función de densidad?
o. ¿Cuáles son los parámetros más usados en estadística para estudiar y utilizar
funciones de distribución de variables aleatorias?
p. ¿Qué es la esperanza matemática de una variable aleatoria? ¿cómo se
denota?
A. Espacio muestral, con qué letra se denota (Ω)

E espacio muestral lo podemos definir con los resultados que podemos obtener en un
experimento aleatorio. Para denotar el espacio muestral lo hacemos con la letra griega
(Ω) (omega) esto da como resultado a un suceso confiable. Un ejemplo de espacio
muestral en el lanzamiento de una moneda seria:
(Ω) = {C, X}
Donde c es cara y la x es cruz.
Esto serían los posibles resultados son cara o cruz
B. Punto muestral. (ω)
Es un elemento de Ω, en otras palabras un dato del experimento Ejemplo, Ω = {ω1,
ω2, ω3, , ..., ωω ωn}
C. Evento muestral. (A).
Este sería un conjunto de posibles resultados del experimento. (A es un subconjunto
de Ω).
D. Variable aleatoria. (V.A).
Encontramos en estas variables ya incluidas en los puntos muéstrales, También estas
variables aleatorias son escogidas al azar en un experimento para ser estudiadas y
definir la similitud con las demás variables.

E. ¿Qué significa que el espacio muestral de una variable aleatoria continua
es no contable?
Bueno el espacio muestral está enfocado en un experimento que se realiza al azar,
esto para poder buscar sus posibles resultados. Un ejemplo de ello podría ser el
análisis de los resultados al lanzar un dado, entonces la cara que caerá al lanzar una
moneda. O también un posible resultado de un juego de futbol a esto le llamaremos
espacio muestral
Al tener ya definido, la variable aleatoria continua, y no podemos reducirla como las
medidas de las personas, y siempre están sujetas al error. Y variable aleatoria no
contable. A esto decimos que nunca podemos saber el número de las opciones que
tendremos como los resultados de un partido.
F. ¿Qué son variables aleatorias discretas proporcionales y que son
variables aleatorias discretas de conteo no acotado? De ejemplos de este
tipo de variables.
Estas son aquellas que solo se pueden en un valor finito de valores, pero dentro de un
intervalo.
Un ejemplo serio, una manada de animales salvajes que puede ser de 4,5,6,7, o 08
individuos, pero nunca pueden ser 5, 65, o 7, 65.
Sabemos que cuando una variable solo es capaz de adquirir un numero finito de
valores dentro de un intervalo decimos que es aleatoria discreta, por ejemplo, la
cantidad de veces que ha llovido en un lugar en un mes, solo puede ser un valor igual
o mayor a 0 y entero. Es por esto por lo que estos valores pueden ser acotados o no.
Un ejemplo de la variable aleatoria discreta de conteo no acotado es la cantidad de

espermatozoides de una muestra de semen, por lo que se tratara de un valor discreto
tipo aleatorio y sin límites precisos.
G. Existen dos conceptos de probabilidad: el clásico y el concepto

frecuencial; defina cada uno
cuando tenemos Ω, es finito, el numero de puntos muestrales es contable. Podemos
dar una definición de probabilidad que se basa en la observación de los elementos del
espacio muestra.
Esta se desarrolló originalmente estudiando los juegos de azar y se conoce como el
enfoque clásico de probabilidad
Supongamos que con A se representa el evento encontrar la semilla germinada, si
se observan 1000 semillas, es decir se repite 1000 veces el ensayo de germinación (,
N=1000) en condiciones que cada observación no afecte a las otras y 600 semillas
germinan (n A=600) decimos que la probabilidad estimada de observar una semilla
germinada está dada por:
nA
P(A) = P (observar una semilla germinada) = =600 /1000=0,6
N
P ( A), Es la definición frecuencia de probabilidad, es distinta ya que se refiere a una
serie repetida de estudios aleatorios, y generalmente esta es usada cuando el espacio
muestral es infinito y por tanto no se pueden enumerar todos los resultados posibles
del estudio
H. ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de
probabilidad?
la analogía es fundamental, las frecuencias se entienden como probabilidades sólo
cuando N tiende a infinito. Si el número de veces que se repite un experimento no es

grande, entonces hablaremos de frecuencia relativa y diremos que ésta “aproxima”
una probabilidad.
I. ¿Qué son eventos mutuamente excluyentes? ¿Cómo es la intersección de

dos eventos mutuamente excluyentes? ¿Si son excluyentes, dado un
evento A y uno B, a que es igual la P(A ꓴ B)?
se entiende que dos eventos son mutuamente excluyentes si cada uno de estos están
formado por puntos muestrales distintos.
Esto quiere decir que no existe ningún punto muestral en la intersección de los
subconjuntos que representan los eventos, por la teoría de los conjuntos se tiene
Si A y B son dos eventos de Ω, la unión de eventos conforma un nuevo conjunto, que
contiene a los puntos muestrales de A y B. que son la unión que denota por AUB.
J. En el caso de distribuciones de variables aleatorias, si una variable es
continua y simétrica, ¿qué modelo se usa?
Usamos un modelo normal.
K. Para una variable de conteo no acotado, ¿qué modelo se utiliza?

Utilizamos un modelo Poisson
L. Para variables de proporciones ¿qué modelo se utiliza?

Utilizamos un modelo probabilístico Binominal.
M. ¿Qué variables tienen función de probabilidad y cuáles variables tienen
función de densidad?
La función de distribución de probabilidad de una variable aleatoria discreta y la
función de densidad de una variable aleatoria continúa denotada como f(.)
N. ¿Cuáles son los parámetros más usados en estadística para estudiar y
utilizar funciones de distribución de variables aleatorias?

Diremos que es la distribución de una variable aleatoria, esto independientemente del
tipo de variable. Esto puede representarse por su función de distribución denotada
como F (y). Esta función asigna a cada valor de la variable un valor entre 0 y 1, esto
nos indica la probabilidad de que la variable observada para un caso particular asuma
un valor que sea menor o igual al valor al que se está evaluando la función.
O. ¿Qué es la esperanza matemática de una variable aleatoria? ¿cómo se

denota?
Bueno podemos decir que es de un punto de vista intuitivo, como un promedio de los
valores asumidos por la variable, donde cada valor es participe por su probabilidad de
ocurrencia. Se denota nota por E (.) o la letra griega Mu (µ).
1. Explique en sus propias palabras el experimento aleatorio del dado.
Al lanzar un dado se logran dar 36, posibles resultados esto se logra combinando cada
número con los otros, se inicia con el numero 1 combinándolo con las otras 6 opciones
del otro dado, así debemos hacerlo con los demás números, del dos al 6 así estriamos
corroborando la información que en realidad serian 36 posibles resultados, es a esto
que le llamamos espacio muestral.
Entonces los puntos muestrales serian 36.
Y los eventos son subconjuntos del espacio muestral. Entonces vemos en este caso
los 36 posibles resultados del dado.
Llegado el caso que en ambos dados salgan números pares se le llama evento, o
también le podemos llamar evento cuando ambos dados salen números iguales.
Entonces habría una probabilidad de obtener 2 números iguales de 6/36=0,166 o en
porcentaje 16,6%
2. Adjunte en el informe los tres gráficos generados por el script (Frecuencias
Absolutas, frecuencias relativas y frecuencias relativas acumuladas). No debe
haber más de un gráfico por página.
PERIODO 951 - Gráfico de barras SUMA DE CARAS

6
5
4
Frecuencias absolutas
3
2
1
0
2 3 4 5 6 7 8 9 10 11 12
mediante este grafico de barras podemos ver los valores y las proporciones
representados en la suma de caras y observado así la diferencia de modo considerado
que hay de una frecuencia a la otra.
PERIODO 951 - FRECUENCIAS RELATIVAS SUMA DE CARAS
0.20
0.15
Frecuencias relativas
0.10
0.05
0.00
2 3 4 5 6 7 8 9 10 11 12
En esta grafica de frecuencia relativa podemos apreciar y hacer comparaciones de las

muestras que están en los diferentes tamaños, esto debido a la suma que hemos
procedido a realizar
PERIODO 951 - FRECUENCIAS RELATIVAS ACUMULADAS SUMA DE CARAS
1.0
0.8
Frecuencias relativas
0.6
0.4
0.2
0.0
2 3 4 5 6 7 8 9 10 11 12
Por medio de esta grafica podemos apreciar la amanera en que va aumentando poco
a poco las barras, esto debido a la acumulación de las caras. Dando como resultado
que entre más acumuladas estén las caras más altas será la grafica
RESUMEN DEL PROGRA R DE LA PRIMERA PARTE “Script Fase 3 - DADOS.txt”
R version 3.5.3 (2019-03-11) -- "Great Truth"
Copyright (C) 2019 The R Foundation for Statistical Computing
Platform: i386-w64-mingw32/i386 (32-bit)
R es un software libre y viene sin GARANTIA ALGUNA.
Usted puede redistribuirlo bajo ciertas circunstancias.
Escriba 'license()' o 'licence()' para detalles de distribucion.
R es un proyecto colaborativo con muchos contribuyentes.
Escriba 'contributors()' para obtener más información y
'citation()' para saber cómo citar R o paquetes de R en publicaciones.
Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,
o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.
Escriba 'q()' para salir de R.
[Previously saved workspace restored]
> # EXPERIMENTO ALEATORIO LANZAR DOS DADOS - PERIODO 951
>
> # Hay 36 posibles resultados, que da de combinar cada número con los demás
> # Iniciamos con el número 1 en el primer dado y lo vamos combinando con las seis posibles opciones
del segundo dado (1,2,3,4,5,6)

> # Hacemos lo mismo con el número 2 del primer dado y las seis combinaciones que puede haber con el
segundo y así sucesivamente,
> # hasta obtener una matriz de ESPACIO MUESTRAL como se presenta a continuación:
> #(1,1), (1,2), (1,3), (1,4), (1,5), (1,6),
> #(2,1), (2,2), (2,3), (2,4), (2,5), (2,6),
> #(3,1), (3,2), (3,3), (3,4), (3,5), (3,6),
> #(4,1), (4,2), (4,3), (4,4), (4,5), (4,6),
> #(5,1), (5,2), (5,3), (5,4), (5,5), (5,6),
> #(6,1), (6,2), (6,3), (6,4), (6,5), (6,6)}
>
> # VEMOS QUE HAY 36 RESULTADOS POSIBLES, POR TANTO ESTE ES EL ESPACIO
MUESTRAL
> # La probabilidad siempre tendrá denominador 36 (x/36)
> # PUNTOS MUESTRALES = 36
> # Los eventos son subconjuntos del espacio muestral (los 36 posibles resultados del dado)
> # Por ejemplo, un evento puede ser que en ambos dados salgan números pares (2,2 4,4 6,6)
> # Otro evento puede ser sacar dos números iguales, en donde se tendrían los siguientes posibles
resultados:
> # POSIBLE RESULTADOS: (1,1),(2,2),(3,3),(4,4),(5,5),(6,6)
> # En este caso habrían 6 resultados de éxito de los 36 posibles del espacio muestral.
> # La probabilidad por tanto de obtener dos números iguales sería: 6/36 = 0.166 O 16,6% en términos
porcentuales
>
> # VARIABLE ALEATORIA Y = SUMA DE VALORES

> # Es otra forma de presentar los 36 posibles eventos del espacio muestral, en donde se suman los
valores obtenidos en cada dado:
>
> #(2), (3), (4), (5), (6), (7),
> #(3), (4), (5), (6), (7), (8),
> #(4), (5), (6), (7), (8), (9),
> #(5), (6), (7), (8), (9), (10),
> #(6), (7), (8), (9), (10), (11),
> #(7), (8), (9), (10), (11), (12)
>
> # De esta forma se puede procesar su análisis en el programa R
>
> #PROCESAMIENTO EN R
>
> # Creamos el vector con los datos sumando los valores de cada dado, como se indicó anteriormente
> # EJEMPLO:
> # (1,1),(1,2),(1,3),(1,4),(1,5),(1,6)
> # Sumando quedará: 2, 3, 4, 5, 6, 7 y así sucesivamente hasta llegar al último evento (6,6):
>
> SUMADADOS=c(2, 3, 4, 5, 6, 7,
+ 3, 4, 5, 6, 7, 8,
+ 4, 5, 6, 7, 8, 9,
+ 5, 6, 7, 8, 9, 10,
+ 6, 7, 8, 9, 10, 11,
+ 7, 8, 9, 10, 11, 12)

>
> # TABLAS DE FRECUENCIAS PARA LA VARIABLE DISCRETA "SUMADADOS":
>
> # En este caso las tabla de frecuencias se desarrollan por pasos:
>
> table(SUMADADOS) # Tabla de frecuencias absolutas
SUMADADOS
2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
> fabs=table(SUMADADOS) # Asignación al comando de Tabla de frecuencias absolutas el
nombre: "fabs"
> fabs
SUMADADOS
2 3 4 5 6 7 8 9 10 11 12
1 2 3 4 5 6 5 4 3 2 1
> fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas
> fabsacum
2 3 4 5 6 7 8 9 10 11 12
1 3 6 10 15 21 26 30 33 35 36
> frel=prop.table(table(SUMADADOS)) # Asignación al comando de Tabla de frecuencias relativas
el nombre: "frel"
> frel # Tabla de frecuencias relativas
SUMADADOS
2 3 4 5 6 7 8
0.02777778 0.05555556 0.08333333 0.11111111 0.13888889 0.16666667 0.13888889

9 10 11 12
0.11111111 0.08333333 0.05555556 0.02777778
> # Podemos decir entonces que la probabilidad que la suma de las dos caras sea igual a 2 es del 0.027 o
2.7% en términos porcentuales.
> # Las probabilidades se multiplican por 100 para expresarlas en porcentaje.
>
> frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
> frelacum
2 3 4 5 6 7 8
0.02777778 0.08333333 0.16666667 0.27777778 0.41666667 0.58333333 0.72222222
9 10 11 12
0.83333333 0.91666667 0.97222222 1.00000000
> # En este caso, la probabilidad de obtener un valor mayor o igual a 2 pero menor de 4 es de 0.083 o
8.3%
> # es lo mismo que sumar la probabilidad de obtener un valor de 2 (0.027) y de 3 (0.055) = 0.083
>
> # GRAFICOS DE FRECUENCIAS:
>
> barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 951 - Gráfico de barras SUMA DE
CARAS") # Gráfico de Frecuencias absolutas
> barplot(frel,ylab="Frecuencias relativas",ylim=c(0,0.2),xlim=c(0,12),main="PERIODO 951 -
FRECUENCIAS RELATIVAS SUMA DE CARAS") # Gráfico de Frecuencias relativas
> barplot(frelacum,ylab="Frecuencias relativas",main="PERIODO 951 - FRECUENCIAS RELATIVAS
ACUMULADAS SUMA DE CARAS") # Gráfico de Frecuencias relativas acumuladas
>
> #Preparado por: Luis Alberto Cáceres - Director de curso
>
GRAFICA MODELOS
PERIODO 951 - Producción de leche Función de Distribución N (misma varianza, distinta media
0.12
0.10
0.08
F(x)
0.06
0.04
0.02
0.00
10 15 20 25 30 35 40
Producción de leche (litros/día)
En esta figura podemos apreciar dos gráficos de la producción de leche, la cual cuenta
con la misma varianza, pero distinta media en una misma grafica.
En esta grafica podemos determinar que existen dos graficas de las cuales en la azul
cuenta con una varianza de 9 litros al igual que en la figura roja no cambia la varianza,
ya que son los mismos animales, pero la azul cuenta con una medida de 25 y la figura
roja tiene una medida de 30 litros de leche, es por eso que tenemos dos picos en la
figura.
PERIODO 951 - Producción de leche Función de Distribución N (misma media, distinta varianza
0.4
0.3
F(x)
0.2
0.1
0.0
10 15 20 25 30 35 40
Producción de leche (litros/día)
Esta figura nos muestra dos gráficos de producción de leche la cual cuenta con la
misma media, pero distinta varianza en una misma grafica.
Mediante esta grafica podemos determinar que existen dos gráficos de los cuales, en
la azul cuenta con una media de 25 litros, al igual que en la figura de color rojo, pero la
de color azul cuenta con una varianza de 9 y la figura roja cuenta con una varianza de
2 litros de leche, aunque tienen l misma varianza su forma cambia, ya que a mayor
varianza más es su amplitud.
PERIODO 951 - Rendimiento de maíz - Función de Distribución N(media.sigma)
0.05
0.04
0.03
F(x)
0.02
0.01
0.00
20 40 60 80 100
Rendimiento (qq/Ha)
PERIODO 951 - Rendimiento de maíz Distribución Normal con área bajo la curva
0.05
0.04
0.03
F(x)
0.02
0.01
0.00
20 40 60 80 100
Rendimiento (qq/Ha)
Esta figura nos muestra una gráfica de rendimiento del maíz que cuenta con una
media de 60 y una varianza de 49. También vemos que cuanta con un rango de
rendimiento de 50 a 65.
Aquí podemos determinar en la gráfica que tenemos que la media es 60, ya que
vemos que es el centro de la gráfica y la varianza es el anchor de la figura seria de 60,
por esto vemos que va desde 30 a 90 qq/Ha, también podemos observar que tiene
según la sobra un rango de rendimiento de la región entre 50 y 65 qq /Ha.
PERIODO 951 - Distribución Binomial - Germinación de semillas
0.25
0.20 (n=10,p=0.25)
Probabilidad del evento
0.15
0.10
0.05
0.00
0 1 2 3 4 5 6 7 8 9 10
Evento (germinación de x semillas)
Esta figura nos muestra una gráfica de distribución binomial la cual es una distribución
de probabilidad discreta, la cual cuenta el número de éxitos de una secuencia, y
contamos con 10 columnas que representan 10 semillas para germinación.
Esta grafica nos muestra que al realizar la prueba que se realizó con 10 semillas
donde hay 0% de probabilidad que germinen las 10 semillas la probabilidad que
germinen 7 semillas es de 0,003%, la probabilidad que germinen menos de 3 semillas
será de 52,55%, probabilidad que germinen más o tres semillas es de 47,44%, la
probabilidad que germinen máximo 5 semillas seria de 98%
RESUMEN DEL PROGRA R DE LA PRIMERA PARTE “SCRIPT FASE 3 –
MODELOS. TX
R version 3.5.3 (2019-03-11) -- "Great Truth"

Copyright (C) 2019 The R Foundation for Statistical Computing
Platform: i386-w64-mingw32/i386 (32-bit)
R es un software libre y viene sin GARANTIA ALGUNA.

Usted puede redistribuirlo bajo ciertas circunstancias.
Escriba 'license()' o 'licence()' para detalles de distribucion.
R es un proyecto colaborativo con muchos contribuyentes.

Escriba 'contributors()' para obtener más información y
'citation()' para saber cómo citar R o paquetes de R en publicaciones.
Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,

o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.
Escriba 'q()' para salir de R.
[Previously saved workspace restored]
> # MODELOS DE DISTRIBUCIONES - PERIODO 951

>
> # DISTRIBUCION NORMAL
> # EJERCIO DE LAS VACAS DEL TAMBO, Libro Estadística y Biometría de Mónica
Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución normal, página
91
> # La producción de leche diaria de las vacas de un tambo se distribuye como el
modelo normal, con esperanza 25 litros (que es la misma media) y varianza de 9 litros
al cuadrado:
> MEDIA=25
> VARIANZA=9
> # A las vacas se les da una nueva ración que aumenta su producción en 5 litros,
pero no cambia la varianza, ya que son los mismos animales:
> MEDIA2=30
> SIGMA=sqrt(VARIANZA)
> x=seq(15,40,by=0.5) #secuencia de valores en un un rango de producción de
leche de 15 a 40 litros
> dnorm(x,MEDIA,SIGMA)
[1] 5.140930e-04 8.836587e-04 1.477283e-03 2.402033e-03 3.798662e-03
[6] 5.842767e-03 8.740630e-03 1.271754e-02 1.799699e-02 2.477039e-02
[11] 3.315905e-02 4.317253e-02 5.467002e-02 6.733290e-02 8.065691e-02
[16] 9.397063e-02 1.064827e-01 1.173551e-01 1.257944e-01 1.311466e-01
[21] 1.329808e-01 1.311466e-01 1.257944e-01 1.173551e-01 1.064827e-01
[26] 9.397063e-02 8.065691e-02 6.733290e-02 5.467002e-02 4.317253e-02
[31] 3.315905e-02 2.477039e-02 1.799699e-02 1.271754e-02 8.740630e-03
[36] 5.842767e-03 3.798662e-03 2.402033e-03 1.477283e-03 8.836587e-04
[41] 5.140930e-04 2.908942e-04 1.600902e-04 8.569012e-05 4.461008e-05
[46] 2.258767e-05 1.112362e-05 5.327914e-06 2.482015e-06 1.124574e-06
[51] 4.955732e-07
>
> # Gráfico de distribución normal con media = 25 y varianza = 9
> # POR FAVOR NO LO CIERRE, ya que sobre este mismo aparecerá el siguiente
gráfico (continúe ejecutando el código)
> # Cuando aparezca el gráfico, seleccione nuevamente el código de ejecución (Editor
R) ubicando el cursor en el MARCO AZUL, donde aparece el nombre del código
> # De esta forma, mantendrá el orden de ejecución dentro del código:
>
> curve(dnorm(x,MEDIA,SIGMA),xlim=c(10,40),col="blue",lwd=2,
+ xlab="Producción de leche (litros/día)",ylab="F(x)",main="PERIODO 951 -
Producción de leche Función de Distribución N (misma varianza, distinta media")
> curve(dnorm(x,MEDIA2,SIGMA),xlim=c(10,40), add=TRUE, col="red", lwd=2)
>
> # se puede observar que cambia la ubicación de la media (esperanza), pero la forma
de ambas gráficas es la misma porque no cambió la varianza
>
> # Ahora se realiza el mismo procedimiento pero en este caso no cambia la media
(esperanza) sino las varianzas:
>
> MEDIA=25
> VARIANZA=9
> VARIANZA1=2
> SIGMA=sqrt(VARIANZA)
> SIGMA1=sqrt(VARIANZA1)
> x=seq(15,40,by=0.5)
> dnorm(x,MEDIA,SIGMA)
[1] 5.140930e-04 8.836587e-04 1.477283e-03 2.402033e-03 3.798662e-03
[6] 5.842767e-03 8.740630e-03 1.271754e-02 1.799699e-02 2.477039e-02
[11] 3.315905e-02 4.317253e-02 5.467002e-02 6.733290e-02 8.065691e-02
[16] 9.397063e-02 1.064827e-01 1.173551e-01 1.257944e-01 1.311466e-01
[21] 1.329808e-01 1.311466e-01 1.257944e-01 1.173551e-01 1.064827e-01
[26] 9.397063e-02 8.065691e-02 6.733290e-02 5.467002e-02 4.317253e-02
[31] 3.315905e-02 2.477039e-02 1.799699e-02 1.271754e-02 8.740630e-03
[36] 5.842767e-03 3.798662e-03 2.402033e-03 1.477283e-03 8.836587e-04
[41] 5.140930e-04 2.908942e-04 1.600902e-04 8.569012e-05 4.461008e-05
[46] 2.258767e-05 1.112362e-05 5.327914e-06 2.482015e-06 1.124574e-06
[51] 4.955732e-07
>
> # POR FAVOR NO LO CIERRE, ya que sobre este mismo aparecerá el siguiente
gráfico (continúe ejecutando el código)
>
> curve(dnorm(x,MEDIA,SIGMA),xlim=c(10,40),ylim=c(0,0.4),col="blue",lwd=2,
+ xlab="Producción de leche (litros/día)",ylab="F(x)",main="PERIODO 951 -
Producción de leche Función de Distribución N (misma media, distinta varianza")
>
> # Este gráfico (de color rojo) le debe aparecer junto con el anterior gráfico de color
azul, en la misma gráfica:
>
> curve(dnorm(x,MEDIA,SIGMA1),xlim=c(10,40), add=TRUE, col="red", lwd=2)
>
> # En este caso ambas gráficas tienen la misma media (o esperanza) pero sus
formas cambiaron porque tienen distinta varianza
> # A mayor varianza, la gráfica tendrá mayor amplitud
>
> # EJERCICIO DE HIBRIDO MAIZ, Libro Estadística y Biometría de Mónica Balzarini,
CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución normal, página 93
>
> # Si Y es el rendimiento de un híbrido de maíz que puede modelarse con una
distribución normal, con media de 60 qq/Ha y varianza de 49 qq/Ha:
> media= 60
> varianza= 49
> sigma=sqrt(varianza)
> sigma
[1] 7
> X=seq(35,85,by=0.5) # Secuencia de valores en un un rango de 35 a 85 qq/Ha
> dnorm(X,media,sigma)
[1] 9.684491e-05 1.246690e-04 1.596703e-04 2.034576e-04 2.579337e-04
[6] 3.253318e-04 4.082527e-04 5.097014e-04 6.331212e-04 7.824238e-04
[11] 9.620142e-04 1.176807e-03 1.432231e-03 1.734223e-03 2.089206e-03
[16] 2.504043e-03 2.985977e-03 3.542545e-03 4.181465e-03 4.910501e-03
[21] 5.737297e-03 6.669190e-03 7.712995e-03 8.874773e-03 1.015958e-02
[26] 1.157120e-02 1.311188e-02 1.478210e-02 1.658026e-02 1.850251e-02
[31] 2.054255e-02 2.269145e-02 2.493758e-02 2.726658e-02 2.966137e-02
[36] 3.210228e-02 3.456725e-02 3.703206e-02 3.947074e-02 4.185592e-02
[41] 4.415934e-02 4.635244e-02 4.840685e-02 5.029505e-02 5.199096e-02
[46] 5.347055e-02 5.471239e-02 5.569818e-02 5.641316e-02 5.684655e-02
[51] 5.699175e-02 5.684655e-02 5.641316e-02 5.569818e-02 5.471239e-02
[56] 5.347055e-02 5.199096e-02 5.029505e-02 4.840685e-02 4.635244e-02
[61] 4.415934e-02 4.185592e-02 3.947074e-02 3.703206e-02 3.456725e-02
[66] 3.210228e-02 2.966137e-02 2.726658e-02 2.493758e-02 2.269145e-02
[71] 2.054255e-02 1.850251e-02 1.658026e-02 1.478210e-02 1.311188e-02
[76] 1.157120e-02 1.015958e-02 8.874773e-03 7.712995e-03 6.669190e-03
[81] 5.737297e-03 4.910501e-03 4.181465e-03 3.542545e-03 2.985977e-03
[86] 2.504043e-03 2.089206e-03 1.734223e-03 1.432231e-03 1.176807e-03
[91] 9.620142e-04 7.824238e-04 6.331212e-04 5.097014e-04 4.082527e-04
[96] 3.253318e-04 2.579337e-04 2.034576e-04 1.596703e-04 1.246690e-04
[101] 9.684491e-05
>
>
> curve(dnorm(x,media,sigma),xlim=c(20,100),col="blue",lwd=2,
+ xlab="Rendimiento (qq/Ha)",ylab="F(x)",main="PERIODO 951 - Rendimiento de
maíz - Función de Distribución N(media.sigma)")
>
> # Especificamos el valor del que queremos saber su probabilidad, en este caso, 50:
> valor=50
> pnorm(valor,media,sigma)
[1] 0.07656373
>
> # Quiere decir que la probabilidad de que el rendimiento esté por debajo de 50 qq/Ha
es de 0.0765 o del 7.65 por ciento
>
> #PROBABILIDAD DE UN VALOR MAYOR
> valor=50
> # Para hallar la probabilidad de un valor mayor que 50, se resta 1 menos la
probabilidad de hallar un valor igual o menor:
>
> 1-pnorm(valor,media,sigma)
[1] 0.9234363
>
> # PROBABILIDAD EN UN RANGO DE VALORES
>
> # Probabilidad que un dato de rendimiento tomado al azar esté comprendido en el
intervalo de 50 a 65 qq/Ha:
> # Reemplaze por el rango de valores, valor 2 es el mayor y valor 1 es el menor:
> valor1=50
> valor2=65
> VALOR1=pnorm(valor1,media,sigma)
> VALOR1
[1] 0.07656373
> VALOR2=pnorm(valor2,media,sigma)
> VALOR2
[1] 0.7624747
>
> # PROBABILIDAD que el rendimiento se encuentre en el intervalo de 50 a 65 qq/Ha:
> VALOR2-VALOR1
[1] 0.685911
>
> # GRAFICA DE ÁREA BAJO LA CURVA ENTRE 50 Y 65 qq/Ha:
>
> regionX=seq(valor1,valor2,0.01) # Intervalo a sombrear
> xP <- c(valor1,regionX,valor2) # Base de los polígonos que crean el efecto
"sombra"
> yP <- c(0,dnorm(regionX,media,sigma),0) # Altura de los polígonos sombreados
>
> # Cuando le abra la gráfica no la cierre y vuelva al Editor R, seleccionando el marco
azul del cuadro, donde aparece el nombre del código
> curve(dnorm(x,media,sigma),xlim=c(20,100),col="blue",lwd=2,
+ xlab="Rendimiento (qq/Ha)",ylab="F(x)",main="PERIODO 951 - Rendimiento de
maíz Distribución Normal con área bajo la curva")
> polygon(xP,yP,col="orange1") # Área bajo la curva entre 50 y 65 qq/Ha
> box() # Crea un marco rodeando el área bajo la curva
>
> # DISTRIBUCION BINOMIAL
> # Ejercicio de la semilla de Panicum, Libro Estadística y Biometría de Mónica
Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución binomial,
página 101:
> # Debe presentar estos resultados en su informe:
>
> # Supóngase que se toman 10 semillas de Panicum sp y se registra el evento
"Germinó"o "No germinó", después de 5 días de sembradas:
> k= 7 # Queremos saber la probabilidad que germinen 7 de las 10 semillas
> n= 10 # Número total de ensayos realizados, en este caso son 10, que fueron el
número de semillas evaluadas
> p= 0.25 # La probabilidad de germinación de las semillas fue del 25 por ciento
>
> dbinom(k,n,p) # PROBABILIDAD DE UN VALOR IGUAL P(X=7), "que germinen
siete semillas"
[1] 0.003089905
>
> # Probabilidad que germinen al menos 3 de las 10 semillas:
> # En este caso, se interpreta como la probabilidad de que germinen tres o más
semillas
> # Es equivalente a la probabilidad que germinen 3 semillas, más la probabilidad que
germinen 4, más la prob. que germinen 5; y así sucesivamente hasta 10.
> # Otra forma de calcularlo es a la inversa, calculando la probabilidad que germinen
menos de 3 y restándole a la probabilidad total:
>
> k1=2 # Hay que calcular la probabilidad de un valor que sea una unidad menor
que el que queremos hallar
>
> pbinom(k1,n,p) # esta es la probabilidad de que germinen menos de 3 semillas
[1] 0.5255928
>
> #Para conocer la probabilidad que germinen 3 o más semillas se resta 1 menos el
anterior resultado:
> 1-pbinom(k1,n,p) # La probabilidad de que germinen 3 o más semillas es de
0.4744 o del 47.44 por ciento
[1] 0.4744072
>
> # Probabilidad de que germinen a lo sumo 5 semillas:
> # A lo sumo se interpreta que germinen máximo 5 semillas
> k2=5
> pbinom(k2,n,p) # La probabilidad de que germinen a lo sumo 5 semillas, es de 0.98
o del 98 por ciento
[1] 0.9802723
>
> # La esperanza de esta variable aleatoria:
> E=n*p
>E
[1] 2.5
>
> # La varianza de esta variable aleatoria:
> V=n*p*(1-p)
>V
[1] 1.875
>
> # Gráfico de distribución Binomial para el ejercicio de germinación de semillas:
>
> x <- 0:n
> prob <- dbinom(x,n,p)
> barplot(prob,col = "red",names.arg=x,
+ xlab="Evento (germinación de x semillas)",ylab="Probabilidad del
evento",main="PERIODO 951 - Distribución Binomial - Germinación de
semillas\n(n=10,p=0.25)")
> #este gráfico muestra la probabilidad de ocurrencia de cada uno de los 11 eventos
posibles, es decir que germinen 0 semillas, 1.., hasta 10.
> # En este caso, cuando p es menor que 0.5, la distribución se encuentra sesgada
positivamente hacia la izquierda
>
> # DISTRIBUCION DE POISSON
>
> # La distribución de Poisson se usa para distribuciones de variables discretas
(conteos)
>
> # EJERCICIO DE LAS PICADURAS DE GORGOJO, Libro Estadística y Biometría de
Mónica Balzarini, CAPITULO 3 - MODELOS PROBABILÍSTICOS - Distribución
Poisson, página 105:
> # Supongamos que el número promedio de picaduras de gorgojo por semilla es 0.2
(es decir, que cada 100 semillas 20 tienen picaduras).
> # PROBABILIDAD DE UN VALOR EXACTO
> x1= 1 # Valor de conteo que se quiere calcular la probabilidad
> lamda=0.2 # En la distribución de Poisson lamda equivale a la media o a la
varianza, son el mismo valor
> dpois(x1,lamda) # La probabilidad de que en 100 semillas una tenga 1 picadura es
de 0.1637 o de 16.37 por ciento
[1] 0.1637462
>
> ## DOS PICADURAS O MAS TOCA A UNO QUITARLE LAS PROBABILIDADES
DE CERO MAS LA DE UNO
> x0=0 # El valor de conteo que se quiere calcular la probabilidad, en este caso
que ninguna semilla tenga picaduras
> x2=1
> lamda=0.2 #media o varianza como es igual
> dpois(x0,lamda) # La probabilidad de que ninguna semilla tenga picaduras es de
0.8187 o del 81.87 por ciento
[1] 0.8187308
> 1-(dpois(x0,lamda)+dpois(x2,lamda)) # 1 menos la SUMA de la probabilidad de
tener cero picaduras mas una picdura (x0+x2)
[1] 0.0175231
> # La probabilidad de que 2 de las 100 semillas tengan picaduras es de 0.0175 o del
1.8 por ciento
>
> #Preparado por: Luis Alberto Cáceres - director de curso
Lea el Capítulo 3 – Modelos probabilísticos del libro Estadística y
Biometría de Mónica Balzarini y responda las siguientes preguntas:
a. Qué tipo de histograma se debe seleccionar en un modelo

probabilístico para una variable aleatoria continua cuando se
Tienen datos de esa variable.
Se podría usar un histograma de tipo simple, en donde cada barra del histograma
proporciona la frecuencia de los datos de la variable que estamos representando.
b. Qué es la estandarización, cuál es su fórmula.
Es un proceso en donde se elabora, aplica y mejora todas las normas que fueron
aplicadas en distintos ejercicios científicos, industriales o socio económicos, con un
solo fin que es de ordenarlas y mejorarlas, la fórmula es:
Es decir, cuando la variable estandarizada a sus valores se les resta su media

aritmética y se divide su desviación estándar.
c. Qué tipo de conteos se trabajan con la distribución Binomial.
Se considera una distribución de probabilidades que nos dice en forma porcentual
realizando una cierta cantidad de pruebas, en donde la probabilidad de cada
posibilidad no será más grande que 1 y tampoco podrá ser negativa
d. En la distribución binomial qué es n y qué es P.
N, representa el número de ensayos o experimentos
p, representa la probabilidad de éxito ante estos experimentos
e. A qué es igual la esperanza y la varianza en la distribución
Binomial.
La esperanza de la variable aleatoria X da como resultado en la siguiente expresión;
E ( X ) =n∗p
En cuanto, la varianza de la variable aleatoria X, siendo de tipo discreta, se calcula de
la siguiente manera;
V ( X )=n∗p∗q
f. Mencione ejemplos en su área de estudio donde se podría
Utilizar la distribución Binomial.
g. Qué tipos de conteos se trabajan con la distribución de Poisson.
Rta: se trabajan conteos NO acotados
h. Cómo se denota el único parámetro de la distribución de

Poisson.
Rta. Esta se especifica por un parámetro λ, este parámetro nos representa la
varianza y la esperanza. Este es un parámetro positivo el cual representa el
número de veces que se espera que ocurra algún fenómeno durante el
transcurso de tiempo.
i. ¿A qué es igual la media y la varianza en la distribución de

Poisson?
Rta. Las medidas de esta varianza de distribución de poisson, es igual que la
esperanza debido a que al aumentar la esperanza también aumenta la varianza
j. Mencione ejemplos en su área de estudio donde se podría

Utilizar la distribución de Poisson
CONCLUSIONES
 Se identificaron cada uno de los modelos de las gráficas de inventario
probabilístico, los pasos, formulas y parámetros.
 Con la elaboración de la actividad se despejaron dudas en cuanto a las

fórmulas utilizadas para cada grafico obtenido y muchos de ellos se repiten por
la relación que hay entre los modelos.
BIBLIOGRAFÍAS
-Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en

problemas de agronomía, p. 257-292. Recuperado
de http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?
docID=3221775&query=bioestadistica
- Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat en

problemas de agronomía. Recuperado
de http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?
docID=3221775&query=bioestadistica

Actividad 3 Estadistica N (2

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Actividad 3 Estadistica N (2

Cargado por

Copyright:

Formatos disponibles

ESTADÍSTICA DESCRIPTIVA

TAREA 3 Distribución y probabilidad

MARLY YULIANA HERRERA

LILIAM JAIDY VARGAS ABAUNZA

CAMILA FERNANDA MALDONADO CASTAÑEDA

CAMILO ANDRÉS CÁRDENAS

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

ESCUELA DE CIENCIAS AGRÍCOLAS, PECUARIAS Y DEL MEDIO AMBIENTE

Atreves de esta actividad veremos formulaciones y conceptos de varias variables

A. Espacio muestral, con qué letra se denota (Ω)

Donde c es cara y la x es cruz.

Esto serían los posibles resultados son cara o cruz

B. Punto muestral. (ω)

Es un elemento de Ω, en otras palabras un dato del experimento Ejemplo, Ω = {ω1,

ω2, ω3, , ..., ωω ωn}

C. Evento muestral. (A).

Este sería un conjunto de posibles resultados del experimento. (A es un subconjunto

D. Variable aleatoria. (V.A).

Encontramos en estas variables ya incluidas en los puntos muéstrales, También estas

variables aleatorias son escogidas al azar en un experimento para ser estudiadas y

definir la similitud con las demás variables.

moneda. O también un posible resultado de un juego de futbol a esto le llamaremos

Al tener ya definido, la variable aleatoria continua, y no podemos reducirla como las

medidas de las personas, y siempre están sujetas al error. Y variable aleatoria no

tendremos como los resultados de un partido.

F. ¿Qué son variables aleatorias discretas proporcionales y que son

variables aleatorias discretas de conteo no acotado? De ejemplos de este

individuos, pero nunca pueden ser 5, 65, o 7, 65.

valores dentro de un intervalo decimos que es aleatoria discreta, por ejemplo, la

Un ejemplo de la variable aleatoria discreta de conteo no acotado es la cantidad de

tipo aleatorio y sin límites precisos.

G. Existen dos conceptos de probabilidad: el clásico y el concepto

P ( A), Es la definición frecuencia de probabilidad, es distinta ya que se refiere a una

serie repetida de estudios aleatorios, y generalmente esta es usada cuando el espacio

H. ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de

la analogía es fundamental, las frecuencias se entienden como probabilidades sólo

cuando N tiende a infinito. Si el número de veces que se repite un experimento no es

I. ¿Qué son eventos mutuamente excluyentes? ¿Cómo es la intersección de

K. Para una variable de conteo no acotado, ¿qué modelo se utiliza?

L. Para variables de proporciones ¿qué modelo se utiliza?

M. ¿Qué variables tienen función de probabilidad y cuáles variables tienen

La función de distribución de probabilidad de una variable aleatoria discreta y la

función de densidad de una variable aleatoria continúa denotada como f(.)

N. ¿Cuáles son los parámetros más usados en estadística para estudiar y

utilizar funciones de distribución de variables aleatorias?

O. ¿Qué es la esperanza matemática de una variable aleatoria? ¿cómo se

ocurrencia. Se denota nota por E (.) o la letra griega Mu (µ).

1. Explique en sus propias palabras el experimento aleatorio del dado.

corroborando la información que en realidad serian 36 posibles resultados, es a esto

que le llamamos espacio muestral.

Entonces los puntos muestrales serian 36.

los 36 posibles resultados del dado.

Entonces habría una probabilidad de obtener 2 números iguales de 6/36=0,166 o en

Absolutas, frecuencias relativas y frecuencias relativas acumuladas). No debe

haber más de un gráfico por página.

PERIODO 951 - Gráfico de barras SUMA DE CARAS

En esta grafica de frecuencia relativa podemos apreciar y hacer comparaciones de las

R version 3.5.3 (2019-03-11) -- "Great Truth"

Copyright (C) 2019 The R Foundation for Statistical Computing

Platform: i386-w64-mingw32/i386 (32-bit)

R es un software libre y viene sin GARANTIA ALGUNA.

Usted puede redistribuirlo bajo ciertas circunstancias.

Escriba 'license()' o 'licence()' para detalles de distribucion.