Está en la página 1de 26

Fase 3 – Distribución y probabilidad

Presentado por:

Laren Dayana Pino Forero

Código (1193218466)

Natalia Tapias Cuervo

Código (1040355896)

Cristian David Reyes Benítez

Código (1037485682)

Grupo colaborativo 300046_9

Presentado a:

Biviana Esperanza Rocha Gil

Universidad Nacional Abierta y a Distancia

Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente

Estadística descriptiva

Abril 2023
1. Actividad basada en el capítulo 2

a. Espacio muestral, con qué letra se denota


El espacio muestra se define como el conjunto de todos los posibles
resultados de un experimento aleatorio (Del cual no podemos percibir
con exactitud su resultado). Se denota con las letras E, S, Ω o U.
Un ejemplo de espacio muestras de tirar un dado es Ω= (1,2,3,4,5 y 6)

b. Punto muestral
Punto muestral (w) es un elemento del espacio muestral Ω, es decir un
resultado particular del experimento. Por ejemplo, al lanzar un dado
numerado de uno a seis, cada uno de los posibles resultados se
considera un punto muestral de ese experimento.

c. Evento muestral
Es un subconjunto del espacio muestra, también puede ser un punto
muestra o un conjunto de puntos muestrales.

d. Variable aleatoria
Es una función que asigna a cada elemento del espacio muestral un
número real y luego a cada uno de estos valores una probabilidad.

e. ¿Qué significa que el espacio muestral de una variable aleatoria continua


es no contable?
Significa que, entre dos valores de la variable, pueden realizarse un
número infinito de otros valores.
f. ¿Qué son variables aleatorias discretas proporcionales y que son
variables aleatorias discretas de conteo no acotado? De ejemplos de
este tipo de variables.
Las proporcionales se definen como aquellas que provienen de conteos
que no pueden superar el número de elementos evaluados. Como
ejemplo: el número de semillas germinadas en cajas de Petri con 25
semillas cada caja; los resultados se expresan como proporciones
porque existe un denominador natural: la Variables aleatorias y
probabilidades 67 cantidad de semillas por caja.
De conteo no acotado: Aquellas que no tienen un denominador natural.
Como ejemplo: es el número de pústulas de roya por m2 de cultivo

g. Existen dos conceptos de probabilidad: el clásico y el frecuencial; defina


cada uno
El clásico: Es la medida que indica la probabilidad de que suceda un
evento. La probabilidad clásica es igual al número de casos favorables
de dicho evento dividido entre el número total de casos posibles.

Frecuencial: Es la relación que hay entre la frecuencia, que es el número


de eventos favorables en el experimento, con el número total de
lanzamientos o intentos. Para calcular la probabilidad frecuencial, es
necesario que los experimentos se realicen.

h. En el caso de la probabilidad frecuencial, explique el experimento de


germinación de una semilla, cuál es el experimento aleatorio, cuál es el
evento y cuantos puntos muestrales tiene
Para este caso el experimento aleatorio es que la semilla pueda
germinar o no. El evento es “encontrar la semilla germinada” y los
puntos muestrales para el caso del ejemplo es 1000 semillas.
i. ¿Qué diferencia existe entre el concepto de frecuencia relativa y el de
probabilidad?
La frecuencia relativa es el cociente entre la frecuencia absoluta de un
evento y el número total de eventos posibles. La probabilidad es una
medida de la fuerza o la certidumbre con que se espera que ocurra un
evento.

j. Defina qué es curtosis y presente ejemplos gráficos de los tipos de


curtosis que existen
La curtosis es una medida estadística que determina el grado de
concentración que presentan los valores de una variable alrededor de la
zona central de la distribución de frecuencias. También es conocida
como medida de apuntamiento.
Existen tres tipos de curtosis:
 Leptocúrtica: Existe una gran concentración de los valores en
torno a su media (g2>3)

 Mesocúrtica: Existe una concentración normal de los valores en


torno a su media (g2=3).
 Platicúrtica: Existe una baja concentración de los valores en torno
a su media (g2<3).

k. ¿Qué significa la simetría o asimetría de una variable? ¿qué tipos de


asimetrías existen? Presente ejemplos gráficos.
La asimetría es la medida que indica la simetría de la distribución de una
variable respecto a la media aritmética, sin necesidad de hacer la
representación gráfica. Los coeficientes de asimetría indican si hay el
mismo número de elementos a izquierda y derecha de la media.
Existen tres tipos de curva de distribución según su asimetría:
 Asimetría negativa: la cola de la distribución se alarga para
valores inferiores a la media.
 Simétrica: hay el mismo número de elementos a izquierda y
derecha de la media. En este caso, coinciden la media, la mediana
y la moda. La distribución se adapta a la forma de la campana de
Gauss, o distribución normal.
 Asimetría positiva: la cola de la distribución se alarga (a la
derecha) para valores superiores a la media.
l. Para una variable de conteo no acotado, ¿qué modelo de distribución se
utiliza?
En este caso se utiliza el modelo de Poisson.

m. Para variables de proporciones ¿qué modelo de distribución se utiliza?


En este caso se utiliza el modelo binomial.

n. ¿Qué variables tienen función de probabilidad y cuáles variables tienen


función de densidad?
Las variables aleatorias continuas tienen función de probabilidad y las
variables aleatorias discretas tienen función de densidad.

o. ¿Cuáles son los parámetros más usados en estadística para estudiar y


utilizar funciones de distribución de variables aleatorias?
Los parámetros más utilizados son la media, la varianza y la desviación
estándar.

p. ¿Qué es la esperanza matemática de una variable aleatoria? ¿cómo se


denota?
La esperanza matemática de una variable aleatoria, usualmente
denotada por E(.) o la letra griega Mu (µ) es, desde un punto de vista
intuitivo, un promedio de los valores asumidos por la variable, donde
cada valor es ponderado por su probabilidad de ocurrencia.
2. Actividad basada en el capítulo 3

a. Qué tipo de modelo probabilístico se debe seleccionar para una variable


aleatoria continua cuando la distribución de datos es simétrica y la
media y la mediana tienen valores similares
El modelo que debe usarse es el Normal.

b. Qué es la estandarización, cuál es su fórmula.


Se llamará estandarización a la siguiente transformación:

𝑌−𝜇
𝑍=
√𝜎 2
Donde Z: es la variable aleatoria obtenida de la estandarización, Y la
variable aleatoria original y μ y σ^2, son la media y la varianza
respectivamente de la distribución de Y.

c. Qué tipo de conteos se trabajan con la distribución Binomial


se trabaja con conteos acotados.

d. En la distribución binomial qué es n y qué es P


n: es la cantidad de experimentos aleatorios.
P: es la probabilidad de ocurrencia de un evento.

e. A qué es igual la esperanza y la varianza en la distribución binomial


La esperanza es equivalente a n*p y la varianza a n*p*(1-p)

f. Qué tipos de conteos se trabajan con la distribución de Poisson


conteos no acotados de eventos independientes.

g. Cómo se denota el único parámetro de la distribución de Poisson


La distribución de Poisson se especifica por un parámetro: lambda (λ).
Este parámetro es igual a la media y la varianza.
h. ¿A qué es igual la media y la varianza en la distribución de Poisson?
Si una variable aleatoria Y se distribuye como Poissson lo denotamos
como: Y~ Poisson (λ). Esta distribución tiene un único parámetro, que
representa la esperanza y también a la varianza, es decir que cuando
Y~ Poisson (λ), se cumple: μ= E(Y) = λ σ^2= V(Y) = λ

i. Realice un cuadro comparativo donde indique 5 variables relacionadas


con su programa de estudio, donde se pueda ver claramente la
diferencia entre el uso de la distribución Binomial y la distribución
Poisson (5 de cada una):

Variable Distribución binomial Distribución de Poisson


Numero de coliformes en - Se espera el resultado de - Se obtiene la probabilidad de
muestra de agua hay o no hay. un numero designado de
- La probabilidad de no éxitos cuando el evento
encontrar coliformes es ocurre en espectro continuo
contante. de tiempo y espacio.
- La cantidad de coliformes - La probabilidad de no
obtenidos es encontrar coliformes en la
independiente de muestra n es constante.
resultados obtenidos - El evento es aleatorio e
anteriormente. independiente de otros
- El número de ensayos es eventos.
constante (n) - El número de ensayos tiende
- La probabilidad de a infinito.
encontrar coliformes es - La probabilidad de obtener
contante. más de un éxito en la
muestra de agua es cero.
Número de pacientes enfermos - Se espera el resultado de - Se obtiene la probabilidad de
con diarrea tiene o no tiene diarrea. un numero designado de
- La probabilidad de no éxitos cuando el evento
encontrar diarrea en el ocurre en espectro continuo
paciente es contante. de tiempo y espacio.
- La cantidad de pacientes - La probabilidad de no
con diarrea obtenidos es encontrar pacientes con
independiente de diarrea en la muestra n es
resultados obtenidos constante.
anteriormente. - El evento es aleatorio e
- El número de ensayos es independiente de otros
constante (n) eventos.
- La probabilidad de - El número de ensayos tiende
encontrar pacientes con a infinito.
diarrea es constante - La probabilidad de obtener
más de un éxito en la
muestra de pacientes es cero.
Numero de muestras - Se espera el resultado - Se obtiene la probabilidad de
contaminadas está contaminada o no. un numero designado de
- La probabilidad de no éxitos cuando el evento
encontrar contaminación ocurre en espectro continuo
en la muestra es de tiempo y espacio.
contante. - La probabilidad de no
- La cantidad de muestras encontrar muestras
contaminadas obtenidas contaminadas en la muestra n
es independiente de es constante.
resultados obtenidos - El evento es aleatorio e
anteriormente. independiente de otros
- El número de ensayos es eventos.
constante (n) - El número de ensayos tiende
- La probabilidad de a infinito.
encontrar contaminación - La probabilidad de obtener
en las muestras es más de un éxito en la
constante muestras es cero.
Número de plagas en árboles - Se espera el resultado - Se obtiene la probabilidad de
hay plagas o no. un numero designado de
- La probabilidad de no éxitos cuando el evento
encontrar plagas en los ocurre en espectro continuo
árboles de la muestra es de tiempo y espacio.
contante. - La probabilidad de no
- La cantidad de plagas encontrar plagas en los
obtenidas es árboles de la muestra n es
independiente de constante.
resultados obtenidos - El evento es aleatorio e
anteriormente. independiente de otros
- El número de ensayos es eventos.
constante (n) - El número de ensayos tiende
- La probabilidad de a infinito.
encontrar plagas en los - La probabilidad de obtener
árboles de las muestras más de un éxito en la
es constante muestra es cero.
La cantidad de animales que hay - Se espera el resultado - Se obtiene la probabilidad de
en las distintas reservas hay animales o no. un numero designado de
ecológicas de un país - La probabilidad de éxitos cuando el evento
encontrar animales en la ocurre en espectro continuo
muestra es contante. de tiempo y espacio.
- La cantidad de animales - La probabilidad de encontrar
obtenida es animales en las reservas de la
independiente de muestra n es constante.
resultados obtenidos - El evento es aleatorio e
anteriormente. independiente de otros
- El número de ensayos es eventos.
constante (n) - El número de ensayos tiende
- La probabilidad de no a infinito.
encontrar animales en - La probabilidad de obtener
las reservas de la más de un éxito en la
muestra es constante muestra es cero.
3. Presentar la siguiente información:

3.1. VARIABLE CUANTITATIVA DISCRETA


 Indicar el nombre de la variable discreta elegida y presentar un cuadro resumen
con los siguientes parámetros estadísticos:

1. Parámetro 2. Valor
Nombre de la variable elegida: Amb_discreta
Valor mínimo: 1
Valor máximo: 5
Media: 2.423
Mediana: 2
Varianza: 1.553
Desviación estándar: 1.246

Procedimientos

a. Media muestral

∑𝑥𝑖
𝑥̅ =
𝑁
533
𝑥̅ = = 2.423
220
b. Mediana

Como los datos son pares se hace el promedio entre los dos valores
centrales posición 110 y 111.
2+2
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = =2
2
c. Varianza

𝑛
1
𝑆 = ∑(𝑥𝑖 − 𝑥̅ )2
2
𝑛
𝑖=1
1
𝑆2 = ∗ ((1 − 2.423)2 + (1 − 2.423)2 + (1 − 2.423)2 +. . . +(2 − 2.423)2
220
+ (2 − 2.423)2 +. . . +(3 − 2.423)2 + (3 − 2.423)2 +. . . +(4 − 2.423)2
+ (4 − 2.423)2 +. . . +(5 − 2.423)2 + (5 − 2.423)2 +. . . +(5 − 2.423)2
341.686
𝑆2 = = 1.553
220

d. Desviación estándar
𝑆 = √𝑆 2
𝑆 = √1.553
𝑆 = 1.24

 Tabla de frecuencias indicando:


1. Valor 2. Frecuencia 3. Frecuencia 4. Frecuencia 5. Frecuencia
Absoluta Relativa Absoluta Relativa
Acumulada acumulada
1 67 0.30 67 0.30
2 53 0.24 120 0.55
3 57 0.26 177 0.80
4 26 0.12 203 0.92
5 17 0.08 220 1.00
 Presentar los siguientes gráficos con su respectiva descripción:

a. Diagrama de barras de Frecuencias Absolutas

El histograma de frecuencias absolutas. Representa la frecuencia absoluta mediante


la altura de las barras. La forma en que muestra esta relación es por cantidad del
número total de valores de datos. En este caso hay una distribución sesgada a la
izquierda donde la mayor parte de datos están ubicados en esta área
b. Diagrama de barras de Frecuencias Relativas

El Histograma de frecuencias relativas representa la frecuencia relativa me-


diante la altura de las barras. La forma en que muestra esta relación es por
por-centajes del número total de valores de datos. En este caso hay una
distribución sesgada a la izquierda donde más del 50% de los datos están en
esta área.
c. Diagrama de barras de Frecuencias Relativas Acumuladas.

Es un gráfico acumulativo (véase Función de distribución) que


representa la frecuencia relativa acumulada hasta cada valor de la
variable. Si el rango es finito el primer valor del rango tiene frecuencia
acumulada (anterior) cero y el último tiene frecuencia acumulada 1
(100%). En este caso se obtiene un gráfico sesgado a la derecha donde
la progresión de los datos es uniforme.
3.2. VARIABLE CUANTITATIVA CONTINUA

 Indicar el nombre de la variable continúa elegida y presentar con los siguientes


parámetros estadísticos

1. Parámetro 2. Valor
Nombre de la variable elegida: Amb_continua
Valor mínimo: 0.26
Valor máximo: 3.04
Media: 1.804
Mediana: 1.8 en el rango (1.76-2.06)
Varianza: 1.553
Desviación estándar: 1.246

Procedimientos

Hallar:

Regla de Sturgers:
𝐾 = 1 + 3.3 ∗ 𝐿𝑜𝑔(𝑁)
𝐾 = 1 + 3.3 ∗ 𝐿𝑜𝑔(220)
𝐾 = 8.73

𝑅𝑎𝑛𝑔𝑜 = 𝑉𝑚𝑎𝑥𝑖𝑚𝑜 − 𝑉𝑚𝑖𝑛𝑖𝑚𝑜


𝑅𝑎𝑛𝑔𝑜 = 3.04 − 0.26 = 2.78

𝑅 2.78
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = = = 0.318 ≈ 0.3
𝐾 8.73
Intervalos ni Ni xi xi* ni xi2 *ni
0.26-0.56 1 1 0.41 0.41 0.1681
0.56-0.86 1 2 0.71 0.71 0.5041
0.86-1.16 9 11 1.01 9.09 9.1809
1.16-1.46 34 45 1.31 44.54 58.3474
1.46-1.76 51 96 1.61 82.11 132.1971
1.76-2.06 69 165 1.91 131.79 251.7189
2.06-2.36 38 203 2.21 83.98 185.5958
2.36-2.66 13 216 2.51 32.63 81.9013
2.66-2.96 3 219 2.81 8.43 23.6883
2.96-3.26 1 220 3.11 3.11 9.6721

a. Media muestral
∑𝑥𝑖 ∗ 𝑛𝑖
𝑥̅ =
𝑁
396.8
𝑥̅ = = 1.804
220
b. Mediana
El rango que mas se repite es 1.76-2.06
c. Varianza
∑𝑥𝑖 2 ∗ 𝑛𝑖
𝑆2 = − 𝑋̅ 2
𝑁
752.976
𝑆2 = − 3.253
220
𝑆 2 = 0.170

d. Desviación estándar
𝑆 = √𝑆 2
𝑆 = √0.170
𝑆 = 0.412
 Tabla de frecuencia indicando

1. Intervalo de 2. Frecuencia 3. Frecuencia 4. Frecuencia 5. Frecuencia


datos Absoluta Relativa Absoluta Relativa
Acumulada acumulada
0.26-0.56 1 0.005 1 0.005
0.56-0.86 1 0.005 2 0.009
0.86-1.16 9 0.041 11 0.050
1.16-1.46 34 0.155 45 0.205
1.46-1.76 51 0.232 96 0.436
1.76-2.06 69 0.314 165 0.750
2.06-2.36 38 0.173 203 0.923
2.36-2.66 13 0.059 216 0.982
2.66-2.96 3 0.014 219 0.995
2.96-3.26 1 0.005 220 1.000
 Presentar los siguientes gráficos con su respectiva descripción:

a. Histograma de frecuencias absolutas

El histograma de frecuencias absolutas. Representa la frecuencia absoluta mediante


la altura de las barras. La forma en que muestra esta relación es por cantidad del
número total de valores de datos. En este caso hay una distribución uniforme donde
la mayor parte de datos se encuentran en el centro de la gráfica. Al ser simétrica se
corrobora que la mediana y la media coinciden y que además puede decirse que la
curtosis de esta figura puede ser leptocúrtica donde hay una gran concentración de
valores en torno a la media.
b. Histograma de frecuencias relativas.

El Histograma de frecuencias relativas representa la frecuencia relativa me-diante la


altura de las barras. La forma en que muestra esta relación es por por-centajes del
número total de valores de datos. En este caso hay una distribución uniforme de los
datos. Al ser simétrica se corrobora que la mediana y la media coinciden y que
además puede decirse que la curtosis de esta figura puede ser leptocúrtica donde
hay una gran concentración de valores en torno a la media.
c. Polígono de frecuencias relativas acumuladas.

El polígono es un diagrama de línea que se obtienen al unir los puntos medios del
lado superior de cada rectángulo del histograma correspondiente. En este caso se
observa la campana que corrobora una distribución simétrica de datos con una
curtosis leptocúrtica y además donde la mediana y la media coinciden, esta puede
ser modelada con la distribución normal.
d. Polígono de frecuencias relativas acumuladas.

El polígono es un diagrama de línea que se obtienen al unir los puntos medios del
lado superior de cada rectángulo del histograma correspondiente. Si el rango es finito
el primer valor del rango tiene frecuencia acumulada (anterior) cero y el último tiene
frecuencia acumulada 1 (100%). Se observa que por ejemplo que entre el rango de
0.26 y 1.20 hay una menor concentración de datos y que entre uno 1.20 y 2.45 la
concentración es mayor.
e. Gráfico de distribución empírica.

La distribución empírica es la función de distribución asociada con una medida


empírica de una muestra. Esta función de distribución acumulativa es una función
escalonada que salta 1/n en cada uno de los n valores dentro de la muestra empírica.
En este caso se mide las posibilidades reales e individuales, sobre la medición de la
puntuación directa del sujeto, o de una opción de la cual se ha medido la frecuencia
de ocurrencia. Con esta función se pueden reconstruir los datos.
Preguntas orientadoras para el análisis de resultados

VARIABLE DISCRETA

1. De los parámetros estadísticos de la variable Amb_discreta obtenidos al


ejecutar el comando summary(Discreta), indique cuál de ellos se necesita para
poder modelar la viable con la distribución de Poisson y su respectivo valor:

Se necesita la media cuyo valor es 2.423

2. ¿Cuál es la probabilidad de encontrar automóviles particulares con 3 pasajeros

La probabilidad es de 0.21 (21%)

3. ¿Cuál es la probabilidad de encontrar automóviles particulares con menos de


2 pasajeros?
La probabilidad es de 0.563 (56.3%)

4. ¿Cuál es la probabilidad de encontrar automóviles particulares con más de 4


pasajeros
La probabilidad es de 0.098 (0.9%)

VARIABLE CONTINUA

1. Indique el valor de los parámetros estadísticos de la variable evaluada,


necesarios para modelarlos por medio de la Distribución normal
Para este caso se requiere conocer la media cuyo valor es 1.795 y la desviación
estándar que tiene un valor 0.408

2. De acuerdo con la resolución del ministerio de ambiente 762 del 18/07/2022,


el límite máximo de concentración de CO (g/km) para vehículos livianos es de
2.11 g/km ¿Cuál es la probabilidad que los vehículos testeados tengan una
emisión de CO mayor a 2?11 g/km?
La probabilidad es de 0.221 (22.1%)
3. Si el límite máximo ideal de emisión de CO (g/km) para vehículos livianos es
de 1.0 g/km, ¿Cuál es la probabilidad de que la emisión en los vehículos
testeados sea igual o menor a este valor

La probabilidad es de 0.026 (0.26%)

4. ¿Cuál es la probabilidad que la emisión de CO (g/km) en los vehículos


testeados se encuentre en el rango de 1.0-2.11 g/km?

Para este ejercicio primero estandarizamos los limites


𝑌−𝜇
𝑍=
√𝜎 2
𝑌−𝜇 1.0 − 1.795
𝑍1 = = = −1.948
√𝜎 2 0.408
𝑌−𝜇 2.11 − 1.795
𝑍2 = = = 0.772
√𝜎 2 0.408

El Cálculo es el siguiente:
P[50≤Y≤ 65]= F(65) - F(50)= P[ Y≤65]- P[Y≤ 50] =P[-1.948≤ Z ≤ 0.772] =P[Z ≤ 0.772 ]-
P[Z≤ -1.948 ] 0,7799- 0.025707 =0.7541
Por lo cual la probabilidad es de 0.7541 (75.4%)

Distribución Binomial

1. ¿Cuál es la probabilidad de encontrar 3 vehículos por fuera de la norma


La probabilidad de encontrar 3 vehículos por fuera de la norma es de 0.000125
(0.0125%)

2. ¿Cuál es la probabilidad de encontrar 7 o menos vehículos por fuera de la


norma?

la probabilidad es de 0.179 (17.9%)

3. ¿Cuál es la probabilidad de encontrar más de 6 vehículos por fuera de la norma


La probabilidad es de 0.950 (95%)
Conclusiones

 El uso de estadísticos permite hacer una presentación de los datos que facilita
el análisis y compresión de estos, además de hacer una proyección que
mediante la probabilidad predice la ocurrencia de otros eventos.

 Con la distribución binomial se puede visualizar la probabilidad de que ocurran


un cierto número de éxitos y esta fórmula se usa para calcular que tan probable
es que ocurra una cosa u otra.

 Las evaluaciones de riesgos descansan sobre el uso apropiado que se haga de


la distribución de probabilidad, además, estas distribuciones muestran la
variabilidad y la incertidumbre de los datos.

 En el caso de la distribución de Poisson se describe la cantidad de veces que


ocurre un evento en un intervalo determinado, debe tenerse en cuenta que esta
distribución es una forma límite de la binomial cuando el éxito es muy pequeño
y la cantidad de datos es grande.

 Con los datos suministrados en el ejercicio se pudo hacer el respectivo análisis


y aplicar la distribución indicada para obtener la probabilidad de un evento. Es
necesario contar con los parámetros de cada distribución.
Bibliografía

CANAVOS, G. (1988) Probabilidad y Estadística. Aplicaciones y Métodos. México: McGraw-Hill.

Di Rienzo, J., Tablada, M. y Balzarini, M. (2012). Estadística y biometría. Córdoba, Argentina: Brujas

FERNáNDEZ CUESTA, C., y FUENTES GARCíA, F. (1995) Curso de Estadística Descriptiva. Teoría y Práctica.
Madrid: Ariel.

Quevedo Urías, H. A. (12 de 08 de 2006). Métodos Estadísticos para la ingeniería

También podría gustarte