Está en la página 1de 10

Taller 4 Probabilidad y Estadı́stica.

Sara Carolina Ramos Infante, Santiago Enrique Gonzalez Uribe

February 2020

1 Punto 1

Para la interpretación de los datos se toma en cuentas las medidas de resumen, que para este ejercicio las
dividimos en 4 tipos: De tendencia central, de posición, de dispersión y de forma.

1.1 Medidas de tendencia

Para el agrupamiento de datos se usa la regla de Sturges; sin embargo, en sentido procedente a sacar in-
tervalos que sean más útiles y no se tengas intervalos sin frecuencia, se prefirió aproximar a piso al usar la
regla.
De tal forma, los cálculos de medidas de tendencia central son los siguientes:

a) x = 810.5143
b) M edx = 838.8889
c) M odx = 920

1.2 Medidas de posición

Para las medidas de posición se establecen los cuartiles de los datos.

a) Q1 = 715
b) Q2 = 839
c) Q3 = 928

1.3 Medidas de dispersión

En las medidas de dispersión se calculará la varianza, el rango, el rango intercuartil,la desviación estándar
y el coeficiente de dispersión.
a) s2 = 16465.61
b) Rango = 462
c) RI = 213
d) s = 128.3184
e) cv = 0.1583173
También se le agrega un boxplot a los datos, teniendo en cuenta que el rango intercuartil abarca 50 % de
los datos.

1
Figure 1: Intensidad solar-Boxplot

1.4 Medidas de forma

Para las medidas de forma se propone la simetrı́a, la curtosis y el histograma.

a) Curtosis = -0.5673098
b) Asimetrı́a = -0.68898
Los coeficientes sugieren que se tiene una distribución con cola izquierda larga y delgada, mientras que se
tiene gruesa a la derecha significando que la mayorı́a de datos están concentrado en hacia una mayor inten-
sidad lumı́nica.
c)Histograma

Figure 2: Histograma de datos

2
1.5 Toma de decisión

Según las medidas de resumen que han sido tomadas se puede ver cómo éstas tienen un influjo en la decisión:

• Asimetrı́a: Los coeficientes de curtosis y de asimetrı́a demuestran que ésta es negativa, por lo cual es
más probable que se tengan lecturas de mayor intensidad.
• Coeficiente de variación: Para el coeficiente de variación se tiene aproximadamente un 16%, por lo
que también lo hace viable.
• Mayorı́a de lecturas: La mediana de estos datos está por encima de 820, por lo que se puede asegurar
que una mayorı́a de datos superan los 820 vatios por metro cuadrado. También esta caracterı́stica de
mayorı́a se puede observar en el BoxPlot..

Figure 3: Desarrollo en R

2 Punto 2

2.1 Punto a

Tabla de frecuencias: Se tiene que dado el número de clases lo que se hace es dividir la longitud del intervalo en
la cantidad de clases. Lo que nos resulta, después de organizar los datos, en la siguiente tabla de frecuencias:

Clases Frecuencia Frecuencia acumulada Marca de clase


[31, 2 − 33, 07] 6 6 32, 58
[33, 07 − 34, 04] 12 18 33, 55
[34, 04 − 35, 01] 22 40 34, 52
[35, 01 − 35, 98] 12 52 35, 49
[35, 98 − 36, 95] 7 59 36.46
[36, 95 − 37, 92] 5 64 37.43

2.2 Punto b

Siendo la marca de clase el intervalo de [34, 04 − 35, 01]

• Con datos agrupados:


a. x = 34, 78
b. M edx = 34, 52
c. M odx = 34, 65

3
• Con datos no agrupados:
a. x = 34, 79
b. M edx = 34, 7
c. M odx = 34, 7

Se puede notar que la media de los datos agrupados y no agrupados no varı́a de forma significativa. Sin
embargo la mediana y la moda tiene un cambio un poco más notorio. Siendo la mediana la que presenta un
mayor cambio, esto se debe a que el valor de 34, 7 es el que aparece con más frecuencia y en la posición n/2
y (n/2) + 1.

2.3 Punto c

Figure 4: Boxplot

No se observan datos atı́picos.

Figure 5: Desarrollo en excel

3 Punto 3

Para este punto se tiene en cuenta que la distribución que se usa es geométrica, por lo que se tienen las sigu-
ientes ecuaciones con respecto a la función acumulativa, el valor esperado y la varianza, teniendo en cuenta
que también se incluye el evento (DouglasCMontgomery,-GeorgeC.Runger-AppliedStatisticsProbabilityforEngineers-
Wiley-Página78) y los intentos:

4
F (x) = 1 − (1 − p)x

1
E(x) =
p

1−p
σ2 =
p2

3.1 Punto a

Sabiendo que el valor esperado tiene un valor de 370, se puede hallar el valor de p, el cual es

p = 0.0027027.

Con la función se prosigue hallando la probabilidad de falla en la muestra 100 o antes. De tal manera, se
llega a que la probabilidad es del 23.71%.

3.2 Punto b

Con esa desviación estándar se tiene un valor para p de −5.0125 · 10−3 o de 4.98752 · 10−3 . Claramente como
un p negativo no tiene sentido, sólo se toma el valor positivo.
Subsecuentemente, se tiene que la ARL es de 200.5.

3.3 Punto c

Si se tiene un número N de intentos antes del fallo y una distribución condicional N-m dado que N>m, se
tiene que es la misma que la distribución de N.

P (N > n + m) (1 − p)n+m
P (N > n + m|N > m) = = = (1 − p)n = P (N > n)
P (N > m) (1 − p)m

Volviendo al enunciado se nos pide P (RL ≥ 301|RL > 200), donde se incluye el evento en 301, pero no
incluyendo el momento de fallo, el intervalo queda de la siguiente manera:

P (RL ≥ 300|RL > 200) = P (RL ≥ 100)


Donde m es igual a 200 y n a 100, se utiliza la falta de memoria y nos apoyamos en el literal a), cuando se
hizo el cálculo para 100 o menos.

P (RL ≥ 100) = 1 − P (RL ≤ 100)

P (RL ≥ 100) = 1 − 0.2371

P (RL ≥ 100) = 0.7629

5
La probabilidad de P (RL ≥ 301|RL > 200) es igual a 76.29%

4 Punto 4

4.1 Punto a

Se tiene que la probabilidad de obtener una opinión favorable es:

p(f ) = p(a) ∗ p(f |a) + p(m) ∗ p(f |m) + p(b) ∗ p(f |b) = 0.615
Lo que nos indica que la probabilidad de que un equipo presente una opinión favorable es del 61, 5%.

4.2 Punto b

En este caso se la probabilidad de p(a) dado que ocurrió p(f ), es decir:

p(a ∩ f )
p(a|f ) = = 0.618
p(f )
Es decir que la probabilidad de que un celular que tuvo opiniones favorables, tenga alta demanda es del
61, 8%

4.3 Punto c

En caso de que un celular Samsung tenga opiniones desfavorables, obtenga la probabilidad de que este tuviese
una alta demanda.

p(a ∩ d)
p(a|d) = = 0.052
1 − p(f )

Es decir que la probabilidad de que se tenga una alta demanda para un equipo desfavorable es del 5, 2%

Figure 6: Desarrollo en R

6
5 Punto 5

5.1 Punto a

Para este literal se puede identificar una distribución hipergeométrica en la cual se tiene como éxito el
número de mujeres M = 4, en una población de N = 14 y una muestra n = 7. Encontrando la distribución
de probabilidad de mujeres que se salvan x, se tiene

Cx4 · C14−x
10
P (x) = 14
C7
M
µ=n·
N

Ası́ se esperarı́a que se salvaran 2 mujeres. Pero se hiciera lo requerido por la ONG, se establece que
habrı́a un población de 12 personas, de las cuales 2 son mujeres y se van a rescatar 5 personas: tal distribución
lleva a un valor esperado de 0.833 mujeres salvadas, como necesariamente hay que aproximar se hace a piso
siendo 0. De tal forma, se sigue esperando que se salven 2 mujeres.

5.2 Punto b

Para este punto se tiene en cuenta que lo más barato serı́a salvar a los 6 cientı́ficos y se va iterando, bajando
el número de cientı́ficos salvados(que inevitablemente llevan a las otras personas que son más caras a ser
salvadas) hasta que se llegue al caso más próximo que supere los 14.000.

6 · 1900 + 1 · 2105 = 13505 < 14000

5 · 1900 + 2 · 2105 = 13710 < 14000


4 · 1900 + 3 · 2105 = 13915 < 14000
3 · 1900 + 4 · 2105 = 14120 < 14000

Teniendo en cuenta que como mı́nimo se tienen que salvar 4 cientı́ficos para que no se superen los 14.000
dolares, se sabe que se tiene 3 posibles resultados aceptables donde se salvan 4,5 o 6 cientı́ficos. De tal
manera, la probabilidad de que se gasten menos de 14.000 us es P (4) + P (5) + P (6), si se tiene en cuenta
una distribución hipergeométrica.

P (6) = 0.00233

P (5) = 0.04895

P (4) = 0.24476

P = 0.24476 + 0.04895 + 0.00233 = 0.29604


Se tiene que la probabilidad de que se excedan de los 14000U SD es 1 − p, entonces: La probabilidad de que
se gasten más de 14.000 dolares es del 70,39%

7
5.3 Punto c

No se puede usar la misma distribución ya que esta distribución se usa con eventos equiprobables. Una
posible solución serı́a aumentar el número de tı́quetes que se le otorgan a las personas pertenecientes a
grupos minoritarios; esto generarı́a que tuviesen mayor probabilidad de ser escogidos.

6 Punto 6

1
Se tiene entonces que λ = 105 y el número total de bits es de 32768. Y para este número total de bits
λ = 0.327

6.1 Punto a

6.1.1 Punto 1

p(x > 1) = 1 − p(x ≥ 1) = 1 − p(x = 0) − p(x = 1) = 0.043

6.1.2 Punto 2

Se sabe que la medı́a de la exponencial es igual a λ1 y la media de la distribución Poisson es λ por lo tanto
el número medio de sectores antes de que ocurra un error es de 3.05

6.2 Punto b

En este caso, lo que se pide es conocer el intervalo de tiempo en el cuál la probabilidad de no recibir una
llamada sea de 0.9.
Se tiene un valor de λ = 6 por lo tanto, usando la función de probabilidad puntual:

0.9 = 1 − eλ·t ⇒ t = 0.383

7 Punto 7

7.1 Punto a

Para este punto se tiene en cuenta la afirmación de G&B:”La altura de la espuma del shampoo de G&B es
mayor a 200mm”, de la cual se espera poder confirmarla o rechazarla. Tomaremos como hipótesis nula que
la espuma es menor o igual 200, mientras que la hipótesis alternativa será que la espuma supera los 200 mm.

H0 : µ ≤ 200
H1 : µ > 200

Como la desviación estándar es conocida, se llevará cabo un Z-test:

8
El resultado nos da que el p-valor es de 0.9938. Como el p-valor es mucho mayor que la significancia, no
se tiene suficiente evidencia para rechazar H0 y los resultados no son estadı́sticamente significativos.

Figure 7: Desarrollo en R

8 Punto 8

Se observa que estas dos poblaciones tienen una distribución binomial y el número de muestras es mayor a 30.

Por eso haciendo una prueba de hipótesis para la diferencia de proporciones se tiene que:

• El P-valor es de 0.202.
• La proporción 1 es de 0.050
• La proporción 2 es de 0.026
• La significancia es de 0.05

Como el P-valor es mayor al nivel de significancia se acepta la hipótesis nula; es decir, podemos afirmar que
la proporción de defectuosos es la misma en las dos máquinas.

Figure 8: Desarrollo en R

9 Punto 9

9.1 Punto a

Haciendo la prueba de hipótesis para la igualdad de varianzas se tiene que:

s21
f=
s22

9
Figure 9: Desarrollo en R

Por lo anterior, no se rechaza la hipótesis nula, por lo tanto se dice que las varianzas son iguales.
Con esto se procede a realizar el cálculo de la diferencia de medias y su respectivo intervalo:
[−2.387; 4, 172]

9.2 Punto b

Para este se hace la diferencia de cada media y se hace una prueba de normalidad (siendo la normalidad
la hipótesis nula). Siguiendo el numeral anterior, se tomará un nivel de significancia de 0.05 se tiene lo
siguiente:

Figure 10: Desarrollo en R

Dado que el P-valor es mayor a la significancia, se acepta la hipótesis nula, y se dice que la diferencia de
medias está distribuida normalmente.

10

También podría gustarte