Está en la página 1de 23

Integrante 1: Federico Andrés Gutierrez Olarte Código: 201614836 Sección:34

Numeral Puntaje
a) /4
b) /4
1 c) /3
d) /2
e) /2
Total punto 1 /15
a) /4
b) /4
2
c) /4
d) /3
Total punto 2 /15
a) /5
b) /5
3
c) /5
d) /5
Total punto 3 /20
a) /5
4 b) /5
c) /5
Total punto 4 /15
a) /3
b) /3
c) /3
d) /3
5
e) /3
f) /3
g) /1
h) /3
Total punto 5 /22

1
a) /4
6 b) /4
c) /1
Total punto 6 /9
a) /12
7
b) /12
Total punto 7 /24

Total /120
Nota /5

2
Punto 1

a) Contando el número de pozos por cuenca se obtuvo la siguiente tabla de datos

Tabla 1. Histograma Cuencas


Cuenca Frecuencia
CAG-PUT 3
COLOMBIA
OFF 2
GUAJIRA OFF 1
GUAJORA OFF 2
LLA 26
VIM 5
VMM 10
VSM 1

Por medio de esta tabla se realizó un gráfico de barra de las variables Cuencas vs Frecuencia, al
analizar el grafico y la tabla se puede concluir que la cuenca con mayor número de pozos es LLA
con un total de 26 y las cuencas con menor cantidad de posos son GUAJIRA OFF y VSM con solo un
pozo cada uno.

Histograma de Frecuencias
30

25

20
Cantidad de pozos

15

10

0
CAG-PUT COLOMBIA GUAJIRA GUAJORA LLA VIM VMM VSM
OFF OFF OFF
Cuencas

Figura 1. Histograma de Frecuencia de las Cuencas

3
b) Analizando el grafico de caja se puede ver el cómo los datos están mayormente agrupados
en la parte del cuartil inferior que en el superior, por lo que se puede concluir que la
distribución es asimétrica a la derecha.
Tabla 2. Datos para el diagrama de caja

1 Cuartil 5983,75
Min 1315
Max 15006
3 Cuartil 11426,75

Diagrama de caja TD
16000
14000
12000
10000
8000
6000
4000
2000
0
5/7/2018

Cuartil 1 min max cuartil 3

Figura 2. Diagrama de caja para la variable Td

c) Con la creación del nuevo indicador se obtuvo la siguiente tabla de frecuencias

Tabla3- Frecuencias nuevo indicador

Bajo 10
Medio 17
Alto 23

4
Histograma de Frecuencias
25

20

Frecuencia
15

10

0
Bajo Medio Alto
TD/TIEMPO TD

Figura 3. Histograma de Frecuencias de TD/TIEMPO TD

Analizando la gráfica se puede ver el cómo la menos de la mitad de los pozos se puede clasificar
como alto en el tiempo que se tarda en encontrar su profundidad.

d)
Tanla 4. Estadisticas descriptivas de la variable TD

Media 8326,22
Error típico 500,6845292
Mediana 8089
Moda #N/A
Desviación estándar 3540,374258
Varianza de la muestra 12534249,89
Curtosis -0,708769022
Coeficiente de asimetría -0,026823978
Rango 13691
Mínimo 1315
Máximo 15006
Suma 416311
Cuenta 50

Mirando la curtosis, se puede ver que este valor es menor a 0 lo cual indica que poca
concentración de datos en la media, debido a estala distribución será Platicúrtica.

Observando el coeficiente de asimetría este es menor que 0, por lo que la función se alargara a
valores menores que la media. Además, también indica que los datos están agrupados de forma
asimétrica hacia la izquierda.

5
e) Se hallo el percentil del 30% para TD por medio de la formula PERCENTIl.INC(matriz;k),
obteniendo el valor de 6652 que representa el percentil del 30% para la profundidad del
pozo (TD). Esto también nos dice que el 30% de los pozos presentan una profundidad
menor o igual a 6652.

Punto 2

a)

El sesgo se calcula para este punto por medio de la siguiente ecuación

𝒔𝒆𝒔𝒈𝒐(𝝁) = 𝑬(𝝁) − 𝝁

Donde:

E(μ) Es el valor esperado del estimador

μ El parámetro del estimador.

En este caso para el estimador de media poblacional μ1 el sesgo se calculará de la siguiente


manera:

𝒔𝒆𝒔𝒈𝒐(𝝁) = 𝑬(𝝁) − 𝝁

Se halla el valor esperado del estimador como:


𝒏 𝒏
∑𝒏 𝒙𝒊 𝟏
̅ ) => 𝑬 ( 𝒊=𝟎 ) => ∗ ∑ 𝑬(𝒙𝒊 )
𝑬(𝝁𝟏 ) = 𝑬(∑ 𝒙
𝒏 𝒏
𝒊=𝟏 𝒊=𝟎

Se sabe que el valor esperado de x es μ por ende:


𝒏
𝟏 𝟏
𝑬(𝝁𝟏 ) = ∗ ∑ 𝑬(𝒙𝒊 ) => ∗ 𝒏𝝁
𝒏 𝒏
𝒊=𝟎

=> 𝑬(𝝁𝟏 ) = 𝝁

Calculando el sesgo

𝒔𝒆𝒔𝒈𝒐(𝝁𝟏 ) = 𝑬(𝝁𝟏 ) − 𝝁

=> 𝒔𝒆𝒔𝒈𝒐(𝝁𝟏 ) = 𝝁 − 𝝁 = 𝟎

6
=> 𝒔𝒆𝒔𝒈𝒐(𝝁𝟏 ) = 𝟎

Teniendo en cuenta el resultado del sesgo para el estimador 𝜇


̂1 se puede concluir que este es
incesgado o centrado.

Ahora se procede a calcular el sesgo de μ2

Primero se calcula el valor esperado de μ2


𝑛
∑𝑛𝑖=0 6 ∗ 𝑖 2 ∗ 𝑥𝑖 6 𝑖2
̂)
𝑬(𝝁𝟐 = 𝐸 ( ) => ∗ 𝐸(∑ 𝑥𝑖 )
𝑛(𝑛 + 1)(2𝑛 + 1) 𝑛(𝑛 + 1)(2𝑛 + 1)
𝑖=0

Se sabe que el valor esperado de x es μ, por ende:

6 𝑖2 6 𝑛(𝑛 + 1)(2𝑛 + 1)
̂)
𝑬(𝝁𝟐 = ∗ 𝑛 ∗ 𝜇 => ∗( ) ∗ 𝑛𝜇
𝑛(𝑛 + 1)(2𝑛 + 1) 𝑛(𝑛 + 1)(2𝑛 + 1) 6

̂)
=> 𝑬(𝝁𝟐 = 𝑛𝜇

̂:
Ya con el valor esperado calculamos el sesgo de 𝝁𝟐

̂)
𝒔𝒆𝒔𝒈𝒐(𝝁 ̂)
𝟐 = 𝑬(𝝁𝟐 −𝝁

̂)
=> 𝒔𝒆𝒔𝒈𝒐(𝝁𝟐 = 𝒏𝝁 − 𝝁

̂𝟐 no es sesgado
Del resultado se determina que el estimador de 𝝁

b) Se procede a calcular Error Cuadrático Medio (ECM) con la siguiente ecuación


2
𝐸𝐶𝑀 = 𝑉𝑎𝑟(𝜇1 − (𝐸(𝜇̂ 1 ) − 𝜇)
̂)

Se procede a calcular el ECM del estimador 𝜇⏞1 , para ello debemos primero calcular la varianza,
para calcular la varianza se utiliza la siguiente ecuación:

7
𝑛
∑𝑛𝑖=0 𝑥𝑖 1 1
𝟏 = 𝑽𝑎𝑟(𝑥̅ ) => 𝑉𝑎𝑟 (
̂)
𝑽𝒂𝒓(𝝁 ) => ∗ ∑ 𝑉𝑎𝑟(𝑥𝑖 ) => 2 ∗ 𝑛𝜎 2
𝑛 𝑛 𝑛
𝑖=0

𝜎2
̂)
=> 𝑽𝒂𝒓(𝝁𝟏 =
𝑛

̂:
Ahora conociendo la varianza se procede a calcular el ECM para 𝝁𝟏

𝜎2 𝜎2 𝜎2
𝑬𝑪𝑴 = − (𝝁 − 𝝁)𝟐 => − (𝟎 )𝟐 =>
𝑛 𝑛 𝑛

𝜎2
=> 𝑬𝑪𝑴 =
𝑛

Ahora se procede a calcular el ECM para 𝜇


̂,
2 pero antes se debe calcular la varianza de este
estimador.
𝑛
∑𝑛𝑖=0 6 ∗ 𝑖 2 ∗ 𝑥𝑖 36 ∗ 𝑖 4
𝑉𝑎𝑟(𝜇
̂)
2 = 𝑉𝑎𝑟 ( ) => 𝑉𝑎𝑟(∑ 𝑥𝑖 )
𝑛(𝑛 + 1)(2𝑛 + 1) 𝑛2 (𝑛 + 1)2 (2𝑛 + 1)2
𝑖=0

𝑛
36 𝑛(𝑛 + 1)(2𝑛 + 1)(3𝑛2 + 3𝑛 − 1)
=> 2 ∗ ∑ 𝑉𝑎𝑟(𝑥𝑖 )
𝑛 (𝑛 + 1)2 (2𝑛 + 1)2 30
𝑖=0

36 (3𝑛2 + 3𝑛 − 1) 𝟔(𝟑𝒏𝟐 + 𝟑𝒏 − 𝟏)𝝈𝟐


=> ∗ 𝑛𝜎 2 => 𝑽𝒂𝒓(𝝁
̂)
𝟐 =
30𝑛 𝟓

Ya con la varianza procedemos a calcular el ECM de este estimador:

̂) ̂) 𝟐
𝑬𝑪𝑴 = 𝑽𝒂𝒓(𝝁𝟐 − (𝑬(𝝁𝟐 − 𝝁)

6(3𝑛2 + 3𝑛 − 1)𝜎 2
=> 𝐸𝐶𝑀 = − (𝑛𝜇 − 𝜇) 2
5

C) Se procede a calcular si los estimadores son consistentes se deben cumplir los siguientes
parámetros:

lim 𝐸(𝜇̂ ) = 𝜇 𝑦 lim 𝑉𝑎𝑟(𝜇̂ ) = 0


𝑛=>∞ 𝑛=>∞

En el caso del estimador 𝜇


̂1 se calculan los límites del valor esperado y la varianza obteniendo los
siguientes valores:

lim 𝐸(𝜇̂ 1 ) = 𝜇 => 𝑐𝑢𝑚𝑝𝑙𝑒


𝑛=>∞

8
𝜎2
lim 𝑉𝑎𝑟(𝜇̂ 1 ) => lim => 0 => 𝑝𝑜𝑟 𝑒𝑛𝑑𝑒 lim 𝑉𝑎𝑟(𝜇̂ 1 ) = 0 => 𝑐𝑢𝑚𝑝𝑙𝑒
𝑛=>∞ 𝑛=>∞ 𝑛 𝑛=>∞

Debido a que el estimador 𝜇̂ 1 cumple con los dos parámetros se puede concluir que este es
consistente.

En el caso del estimador 𝜇̂ 2 se procede a evaluar los limites.

lim 𝐸(𝜇̂ 2 ) = 𝑛𝜇 = ∞ => lim 𝐸(𝜇̂ 2 ) = ∞ => 𝑛𝑜 𝑐𝑢𝑚𝑝𝑙𝑒


𝑛=>∞ 𝑛=>∞

𝟔(𝟑𝒏𝟐 + 𝟑𝒏 − 𝟏)𝝈𝟐
lim 𝑉𝑎𝑟(𝜇̂ 2 ) => lim = ∞ => lim 𝑉𝑎𝑟(𝜇̂ 2 ) = ∞ => 𝑛𝑜 𝑐𝑢𝑚𝑝𝑙𝑒
𝑛=>∞ 𝑛=>∞ 𝟓 𝑛=>∞

Como el estimador 𝜇̂ 2 no cumple con ninguno de los dos parámetros entonces se concluye que
este estimador no es consistente.

d)

Punto 3

a) Para hallar el estimador de máxima verosimilitud se procede a realizar los siguientes pasos:

1. Calcular la verosimilitud
𝑛 𝑛 𝑛 𝒏
1 (𝑥 −5) 1 (𝑥 −5) 1 − ∑𝒊=𝟏 𝒙𝒊 𝟓
− 𝑖 − 𝑖 ( ∗𝒏)
ȴ(𝜷) = ∏ 𝑓𝑥 (𝑥𝑖 ) => ∏( )𝑛 𝑒 𝛽 => ( )𝑛 ∏ 𝑒 𝛽 => ( )𝑛 𝒆 𝜷 𝒆 𝜷
𝛽 𝛽 𝛽
𝑖=1 𝑖=1 𝒊=𝟏
2. Calcular el logaritmo de la verosimilitud
𝒏
1 𝑛 − ∑𝒊=𝟏 𝒙𝒊 𝟓
( ∗𝒏)
𝒍𝒏(𝑳(𝜷)) = 𝒍𝒏 (( ) ) + 𝒍𝒏 (𝒆 𝜷 ) + 𝒍𝒏 (𝒆 𝜷 )
𝛽
∑𝒏𝒊=𝟏 𝒙𝒊 𝟓𝒏
=> −𝒏𝒍𝒏(𝜷) − +
𝜷 𝜷

𝒅𝒍𝒏(𝑳(𝜷))
3.Despejar β para que cumpla 𝒅𝜷
=𝟎
𝒅𝒍𝒏(𝑳(𝜷)) 𝒅 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟓𝒏
= (−𝒏𝒍𝒏(𝜷) − + )
𝒅𝜷 𝒅𝜷 𝜷 𝜷
𝒏
𝒅 𝒅 ∑𝒊=𝟏 𝒙𝒊 𝒅 𝟓𝒏
=> −𝒏 (𝒍𝒏(𝜷)) − ( )+ ( )
𝒅𝜷 𝒅𝜷 𝜷 𝒅𝜷 𝜷
−𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟓𝒏
=> + − 𝟐
𝜷 𝜷𝟐 𝜷

9
𝒅𝒍𝒏(𝑳(𝜷))
Igualando a 𝒅𝜷
= 𝟎 y despejando β para hallar el mejor estimador
−𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟓𝒏
+ − 𝟐 =𝟎
𝜷 𝜷𝟐 𝜷
𝒏
−𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟓𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟓𝒏
=− + => −𝒏𝜷 = − ∑ 𝒙𝒊 + 𝟓𝒏 => 𝜷 = − +
𝜷 𝜷𝟐 𝜷𝟐 −𝒏 −𝒏
𝒊=𝟏
∑𝒏 𝒙
̂ = 𝒊=𝟏 𝒊 − 𝟓 => 𝜷
𝜷 ̂=𝒙
̅−𝟓
𝒏

4. Se comprueba que es un máximo, con el criterio de la segunda derivada


𝒅𝟐 𝒍𝒏(𝑳(𝜷))
𝒅𝜷𝟐
̂
|𝜷 = 𝜷

𝒅𝟐 𝒍𝒏(𝑳(𝜷)) 𝒅 −𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟓𝒏 𝒅 −𝒏 𝒅 ∑𝒏𝒊=𝟏 𝒙𝒊 𝒅 𝟓𝒏


𝟐
= ( + 𝟐
− 𝟐 ) => ( ) + ( 𝟐 )− ( )
𝒅𝜷 𝒅𝜷 𝜷 𝜷 𝜷 𝒅𝜷 𝜷 𝒅𝜷 𝜷 𝒅𝜷 𝜷𝟐
𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟓𝒏 𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊 𝟓
=> 𝟐 − ( ) + ( ) => (𝟏 − + )
𝜷 𝜷𝟑 𝜷𝟑 𝜷𝟐 𝜷 𝜷
𝟐 𝒏 𝒏
𝒅 𝒍𝒏(𝑳(𝜷)) 𝟎 𝒏 ∑𝒊=𝟏 𝒙𝒊 𝟓 𝒏 ∑𝒊=𝟏 𝒙𝒊 𝟓
| ̂ = 𝟐 (𝟏 − + ) => (𝟏 − + )<𝟎
𝒅𝜷 𝟐 𝜷=𝜷 𝜷 ̂ ̂
𝜷 ̂
𝜷 ̅−𝟓
𝒙 𝟐 ̅−𝟓
𝒙 ̅−𝟓
𝒙

Debido a que la segunda derivada es menor que 0 se puede asegurar que este es un
máximo, por lo que el estimador de máxima verosimilitud es:
̂=𝒙
𝜷 ̅−𝟓

b) Se debe determinar el sesgo del estimador de máxima verosimilitud, por medio de la


siguiente ecuación:
𝑺𝒆𝒔𝒈𝒐 = 𝑬(𝜷 ̂) − 𝜷
Para ello se debe de hallar el valor esperado del estimador 𝛽̂, debido a que no nos
presentan cuanto es el valor esperado de x este se debe calcular por medio de la siguiente
integral:

1 −(𝑥𝑖𝛽−5)
∫ 𝑒 𝑑𝑥
5 𝛽
Solucionando la integral y evaluándola se halla el valor esperado de x

1 −(𝑥𝑖𝛽−5)
∫ 𝑒 𝑑𝑥 => 𝐸(𝛽) = 𝛽 + 5
5 𝛽

Ahora calculando el sesgo con el valor esperado se obtiene:


𝒏
𝟏
̂ ) − 𝜷 => 𝑬(𝒙
𝑺𝒆𝒔𝒈𝒐 = 𝑬(𝜷 ̅ − 𝟓) − 𝜷 => 𝑬(∑ 𝒙𝒊 ) − 𝟓 − 𝜷
𝒏
𝒊=𝟏
𝟏
=> 𝒏𝑬(𝒙) − 𝟓 − 𝜷 => 𝜷 + 𝟓 − 𝟓 − 𝜷 = 𝟎 => 𝑺𝒆𝒔𝒈𝒐 = 𝟎
𝒏
10
Debido a que el sesgo es 0 se concluye que el estimador es insesgado.

c) Ahora se procede a calcular la consistencia del parámetro, para ello se deben tener en
cuenta los siguientes parámetros
lim 𝐸(𝜷 ̂ ) = 𝛽 𝑦 lim 𝑉𝑎𝑟(𝜷 ̂) = 0
𝑛=>∞ 𝑛=>∞

Se procede a comprobar el parámetro del valor esperado:


lim 𝐸(𝜷̂ ) = 0 => 𝑁𝑜 𝐶𝑢𝑚𝑝𝑙𝑒
𝑛=>∞
Antes de realizar la comprobación se procede a hallar la varianza por medio de la siguiente
ecuación:
𝑉𝑎𝑟(𝑥) = (𝐸 (𝑥 2 )) − (𝐸(𝑥))2
Se halla el valor del valor esperado de 𝑥 2 por medio de la siguiente integral:

1 𝑥−5
∫ 𝑥 2 ∗ 𝑒 −( 𝑛 ) 𝑑𝑥 = 2𝛽 2 + 10𝛽 + 25
5 𝛽
2
Ya con el valor esperado de 𝑥 se procede a calcular la varianza
𝑉𝑎𝑟(𝑥) = 2𝛽 2 + 10𝛽 + 25 − (𝛽 + 5)2 = 𝛽 2

Ya con la varianza de 𝑥 2 se procede a calcular la varianza del estimador


𝑛
1
𝑉𝑎𝑟(𝛽̂ ) = 𝑉𝑎𝑟(𝑥̅ − 5) => 𝑉𝑎𝑟(𝑥̅ ) − 𝑉𝑎𝑟(5) => 𝑉𝑎𝑟(∑ 𝑥𝑖 )
𝑛2
𝑖=1
1 1
=> 2 𝑛𝑉𝑎𝑟(𝑥) => 𝛽 2
𝑛 𝑛
Ahora comprobando el parámetro:
𝛽2
lim 𝑉𝑎𝑟(𝜷 ̂ ) => lim = 0 => lim 𝑉𝑎𝑟(𝛽̂ ) = 0 = 𝑐𝑢𝑚𝑝𝑙𝑒
𝑛=>∞ 𝑛=>∞ 𝑛 𝑛=>∞

Debido a que cumple el parámetro de la varianza, pero no cumple el parámetro del valor
esperado se concluye que el estimador no es consistente.

d) Para determinar si el estimador es eficiente se debe de comprobar que este es


insesgado y que la varianza sea igual a la cota de Rao Cramer. Ya se comprobó que el
estimador no es insesgado, se puede decir que no es eficiente, ahora se comprueba que es
eficiente calculando la cota Rao Crammer
1
𝐶𝑅𝐶 = 2
𝑑
−𝑁𝐸[ 2 (𝑙𝑛[𝑓(𝑥) ])
𝑑𝛽

1. Calculamos el denominador

11
𝑑2 1 2(𝑥 − 5) 1 2(𝐸(𝑥) − 5)
−𝑛𝐸[ 2 (𝑙𝑛[𝑓(𝑥) ]) = −𝑛𝐸 [ 2 − ( 3 )] = −𝑁( 2 − )
𝑑𝛽 𝛽 𝛽 𝛽 𝛽3
1 2(𝛽 + 5 − 5) 1
=> −𝑁 ( 2 − 3 ) => −𝑁 (− 2 )
𝛽 𝛽 𝛽
2. Remplazamos en la ecuación de CRC
1 𝜷𝟐
𝐶𝑅𝐶 = =
1 𝒏
−𝑁 (− 2 )
𝛽
Dado que la cota Rao Crammer es igual a la varianza, por lo tanto el estimador si
es eficiente.
Punto 4.
Para este caso se tienen los siguientes datos.
𝑋: 𝐸𝑠𝑝𝑒𝑠𝑜𝑟 𝑑𝑒 𝑙𝑎𝑠 𝑙á𝑚𝑖𝑛𝑎𝑠 𝑑𝑒 𝑝𝑙á𝑠𝑡𝑖𝑐𝑜
𝑋~𝑁𝑜𝑟𝑚𝑎𝑙 (0,2; 𝜎 2 )
𝑆 = 1.573𝑐𝑚
𝑆 2 = 2.474329 𝑐𝑚
a)
Se procede a calcular la probabilidad solicitada, debido a que en este caso la
varianza es desconocida se debe utilizar el estimador de  S, como ya nos dan el
valor de S es solo remplazar para hallar el valor de la probabilidad, conociendo
que se distribuye como una función t student

𝑥̅ − 𝑎 0.2 − 0.25 −0.05


𝑃 (𝑊 > ) => 𝑃 (𝑊 > ) => 𝑃 (𝑊 > )
𝑆 1.573 0.3517
( )
√𝑛 √20
=> 𝑃(𝑊 > −0.142) => 𝑃(𝑊 < 0.142) = 0.556
La probabilidad de que se tenga que desechar el lote de 20 láminas que se tomo
es de 0.556. Esta probabilidad se halló con la ecuación de Excel
=T.DIST(0,142;19;TRUE).

b) Aquí se presenta un nuevo dato, el cual es la desviación estándar del espesor de


las laminas 𝜎𝑥 = 0,15
En este caso como nos dan la desviación estándar poblacional se trata de una
distribución normal, por lo que para el cálculo de la probabilidad se realiza el
siguiente calculo:

𝑥̅ − 𝑎 0.2 − 0.25 −0.05


𝑃 (𝑍 > ) => 𝑃 (𝑍 > ) => 𝑃 (𝑍 > )
𝜎 0.15 0.03354
( )
√𝑛 √20
=> 𝑃(𝑍 > −1.491) => 𝑃(𝑍 > 1.491) = 0.932
La probabilidad se calculó por medio de la función de Excel
=NORM.DIST(1,491;0,2;0,15; TRUE).

12
Por lo que la probabilidad de que este nuevo lote de 20 láminas se tenga que
desechar es de 0.932

c) Para este nuevo caso nos presentan la varianza muestral máxima de espesor
para un lote de 40 laminas 𝑆 = 0,025𝑐𝑚2 y se nos pide determinar la
probabilidad de que unos lotes de 40 láminas seleccionadas al azar presenten una
varianza de espesor de lámina mayor a la establecida. En este caso se trata de una
probabilidad con distribución chi-cuadrado, la probabilidad’ se hallaría de la
siguiente manera:
𝑆2 0.025 0.75
𝑃 (𝑆 2 > (𝑛 − 1)) => 𝑃 (𝑆 2 > 2
(40 − 1)) => 𝑃 (𝑆 2 > )
𝑎 0.15 0.152
=> 𝑃(𝑆 2 > 43.333) = 1 − 𝑃(𝑆 2 < 43.333) = 0.292
La probabilidad de que para un total de 40 lamina la varianza muestral de espesor
supere el máximo permitido es de 0.292.
Esta probabilidad se halló por medio de la ecuación de Excel
=1-CHISQ.DIST(43,333;39;TRUE)

Punto 5.

a) Intervalo de confianza del 90% para cada tipo de tren, para realizar los cálculos del
promedio de distancia recorrida.
=1-0.90
=0.10=> para todos los casos

Tren Bala
𝑋̅ = 13,7 𝑚 𝑆 = 1𝑚 𝑛 = 15
𝑆 𝑆
𝐼𝐶(90%) = (𝑥̅ − 𝑡(1−𝛼;(𝑛−1) , 𝑥̅ + 𝑡(1−𝛼;(𝑛−1) )
2 √𝑛 2 √𝑛
1 1
𝐼𝐶(90%) = (13.7 − 1.761 , 13.7 + 1.761
√15 √15
𝑰𝑪(𝟗𝟎%) = [𝟏𝟑. 𝟐𝟒𝟓, 𝟏𝟒. 𝟏𝟓𝟓]
Tren Metropolitano
𝑋̅ = 13.4𝑚 𝑆 = 1.5𝑚 𝑛 = 11
𝑆 𝑆
𝐼𝐶(90%) = (𝑥̅ − 𝑡(1−𝛼;(𝑛−1) , 𝑥̅ + 𝑡(1−𝛼;(𝑛−1) )
2 √𝑛 2 √𝑛
1.5 1.5
𝐼𝐶(90%) = (13.4 − 1.812 , 13.4 + 1.812
√11 √11
𝑰𝑪(𝟗𝟎%) [𝟏𝟐. 𝟓𝟖𝟎, 𝟏𝟒. 𝟐𝟏𝟗]

13
Para el cálculo del valor de la expresión 𝑡(1−𝛼;(𝑛−1) se utilizó la fórmula de Excel
2
T.INV(probability;deg_freedom)

b) Intervalo de confianza del 98% para cada tipo de tren, para realizar los cálculos de la
varianza de la distancia recorrida.
=1-0.98
=0.02=> para todos los casos

Tren Bala
𝑋̅ = 13,7 𝑚 𝑆 = 1𝑚 𝑛 = 15
(𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2
𝐼𝐶(98%) = ( 2 ; 2 )
𝑋 𝛼 𝑋 𝛼
(1− ;(𝑛−1)) ( ;(𝑛−1))
2 2

(15 − 1)(1)2 (15 − 1)(1)2


𝐼𝐶(98%) = ( ; )
29.141 4.660

𝑰𝑪(𝟗𝟖%) = [𝟎. 𝟒𝟖𝟎, 𝟑. 𝟎𝟎𝟒]


Tren Metropolitano
𝑋̅ = 13.4𝑚 𝑆 = 1.5𝑚 𝑛 = 11
(𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2
𝐼𝐶(98%) = ( ; )
𝑋2 𝛼 𝑋2 𝛼
(1− ;(𝑛−1)) ( ;(𝑛−1))
2 2

(11 − 1)(1.5)2 (11 − 1)(1.5)2


𝐼𝐶(98%) = ( ; )
23.209 2.558

𝑰𝑪(𝟗𝟖%) = [𝟎. 𝟗𝟔𝟗, 𝟖. 𝟕𝟗𝟔]

Para el cálculo del valor de la expresión 𝑋 2 𝛼 𝑦 𝑋2 𝛼 se utilizó la fórmula


(1− ;(𝑛−1)) ( ;(𝑛−1))
2 2

de Excel CHISQ.INV(probabillity;deg_freedom)

c) Se procede a calcular la diferencia entre las varianzas de la distancia recorrida por medio
de la siguiente ecuación:
𝜶 = 𝟏 − 𝟎, 𝟗𝟓
𝜶 = 𝟎, 𝟎𝟓
𝑛𝑥 = 15 𝑛𝑦 = 11 𝑆 2 𝑥 = 1𝑚 𝑆 2 𝑦 = 2.25

14
𝑆 2𝑥 𝑆2𝑥
𝐼𝐶(95%) = ( 𝐹 𝛼 ; 𝐹 𝛼 )
𝑆 2 𝑦 ( 2 ;(𝑛𝑦 −1);(𝑛𝑥 −1)) 𝑆 2 𝑦 (1−2 ;(𝑛𝑦 −1);(𝑛𝑥 −1))

1 1
𝐼𝐶(95%) = ( 0.282; 3.147)
2.25 2.25

𝑰𝑪(𝟗𝟓%) = [𝟎. 𝟏𝟐𝟓, 𝟏. 𝟑𝟗𝟗]

Debido a que dentro del intervalo de confianza se encuentra el valor de 1 se puede concluir que
las varianzas si llegan a ser iguales.

d) En este cálculo se debe calcular la diferencia entre las medias de distancia de los dos tipos
de trenes para un intervalo del 99%, se procede a realizar el cálculo del IC:
𝜶 = 𝟏 − 𝟎, 𝟗𝟗
𝜶 = 𝟎, 𝟎𝟏
𝑛𝑥 = 15 𝑛𝑦 = 11 𝑆 2 𝑥 = 1𝑚2 𝑆 2 𝑦 = 2.25𝑚2 𝑋̅ = 13.7𝑚 𝑌̿ =13.4m

(𝑛𝑥 − 1)𝑆 2 𝑥 + (𝑛𝑦 − 1)𝑆 2 𝑦 1 1


𝐼𝐶(99%) = (𝑋̅ − 𝑌̅ ± 𝑡 𝛼 (√ ∗ √ + ))
(1− ;(𝑛𝑥 +𝑛𝑦 −2))
2 𝑛𝑥 + 𝑛𝑦 − 2 𝑛𝑥 𝑛𝑦

(15 − 1)1 + (11 − 1)2.25 1 1


𝐼𝐶(99%) = (13.7 − 13.4 ± 2.797 (√ ∗ √ + ))
15 + 11 − 2 15 11

𝑰𝑪(𝟗𝟗%) = [−𝟏. 𝟎𝟔𝟗, 𝟏. 𝟔𝟔𝟗]

Como dentro del intervalo de confianza se encuentra el valor de 0 es correcto afirmar que
las medias de distancias de los dos tipos de trenes si son iguales.
Para hallar el valor de la expresión 𝑡 𝛼 se utilizó la fórmula de Excel
(1− ;(𝑛𝑥 +𝑛𝑦 −2))
2

T.INV(probability;deg_freedom)

e) En este caso nos piden la proporción de trenes bala que presentan una distancia recorrida
mayor a 13.8 metros con un intervalo de confianza del 90% a continuación, se procede a
realizar el cálculo de dicho intervalo de confianza.
Se debe tener presente que en este caso el éxito será que presenta una mayor distancia a
la establecida por la empresa.
𝜶 = 𝟏 − 𝟎, 𝟗𝟎
𝜶 = 𝟎, 𝟏𝟎
𝒏𝒙 = 𝟔𝟎 𝒙𝒆𝒙𝒊𝒕𝒐𝒔 = 𝟒𝟖

15
𝑥 𝑥
𝑥𝑒𝑥𝑖𝑡𝑜𝑠 ( 𝑒𝑥𝑖𝑡𝑜𝑠 )(1 − 𝑒𝑥𝑖𝑡𝑜𝑠 )
𝑛 𝑛𝑥
𝐼𝐶(90%) = ± 𝑧(1−𝛼) √ 𝑥
𝑛𝑥 2 𝑛𝑥

48 48
48 √(60)(1 − 60)
𝐼𝐶(90%) = ± 1.645
60 60

𝑰𝑪(𝟗𝟎%) = [𝟎. 𝟕𝟏𝟓, 𝟎. 𝟖𝟖𝟓]

El valor de la expresión 𝑧(1−𝛼) se halló por medio de la fórmula de Excel


2
NORM.S.INV(probability) => NORM.S.INV(1-(0,10/2))= 1.645

f) En este caso se debe de hallar la proporción de trenes metropolitanos que presentan una
distancia recorrida menor a 13.8m con un intervalo de confianza del 90%, se procede a
realizar el cálculo del intervalo de confianza solicitado:
Se debe tener presente que en este caso el éxito será que presenta una menor distancia a
la establecida por la empresa.
𝜶 = 𝟏 − 𝟎, 𝟗𝟎
𝜶 = 𝟎, 𝟏𝟎
𝒏𝒙 = 𝟕𝟐 𝒙𝒆𝒙𝒊𝒕𝒐𝒔 = 𝟐𝟗

𝑦 𝑦
( 𝑒𝑥𝑖𝑡𝑜𝑠 )(1 − 𝑒𝑥𝑖𝑡𝑜𝑠 )
𝑦𝑒𝑥𝑖𝑡𝑜𝑠 𝑛 𝑛𝑦
± 𝑧(1−𝛼) √
𝑦
𝐼𝐶(90%) =
𝑛𝑦 2 𝑛𝑦

29 29
29 √( )(1 − )
𝐼𝐶(90%) = ± 1.645 72 72
72 72

𝑰𝑪(𝟗𝟎%) = [𝟎. 𝟑𝟎𝟖, 𝟎. 𝟒𝟗𝟖]


El valor de la expresión 𝑧(1−𝛼) se halló por medio de la fórmula de Excel
2
NORM.S.INV(probability) => NORM.S.INV(1-(0,10/2))= 1.645

g) Analizando los valores del intervalo de confianza de las dos pruebas antes realizadas se
puede concluir que el valor de la proporción de trenes bala que presentan una mayor
distancia a 13.8m es mayor a la proporción de trenes metropolitanos que recorren una
distancia menor a 13.8m, esto debido a que el intervalo de confianza de la prueba del
numeral a) presenta límites de mayor valor a los calculados en el numeral b)

16
h) En este caso se debe calcular una diferencia de proporciones entre los trenes balas y los
trenes metropolitanos que presentan una distancia recorrida mayor a 13.8m con un
intervalo de confianza del 92%, se procede a realizar los cálculos:
Se debe tener presente que en este caso el éxito será que presenta una menor distancia a
la establecida por la empresa
𝜶 = 𝟏 − 𝟎, 𝟗𝟐
𝜶 = 𝟎, 𝟎𝟖

𝑛𝑥 = 60 𝑛𝑦 = 72 𝑥𝑒𝑥𝑖𝑡𝑜 = 48 𝑦𝑒𝑥𝑖𝑡𝑜 = 43

𝑥𝑒𝑥𝑖𝑡𝑜 𝑥𝑒𝑥𝑖𝑡𝑜 𝑦𝑒𝑥𝑖𝑡𝑜 𝑦


(1 − ) (1 − 𝑒𝑥𝑖𝑡𝑜 )
𝑥𝑒𝑥𝑖𝑡𝑜 𝑦𝑒𝑥𝑖𝑡𝑜 √ 𝑛𝑥 𝑛𝑥 𝑛𝑦 𝑛𝑦
𝐼𝐶(92%) = − ± 𝑧(1−𝛼) +
𝑛𝑥 𝑛𝑦 2 𝑛𝑥 𝑛𝑦

48 48 43 43
48 43 √60 (1 − 60) 72 (1 − 72)
𝐼𝐶(92%) = − ± 1.751 +
60 72 60 72

𝑰𝑪(𝟗𝟐%) = [𝟎. 𝟎𝟔𝟕, 𝟎. 𝟑𝟑𝟖]


Debido a que dentro del intervalo de confianza no se encuentra exactamente el valor de 0
las proporciones no son iguales. El modelo que presenta una mejor opción para la
compañía debido a su proporción seria el tren bala ya que presentaría un mayor valor de
proporción que el del tren metropolitano.

Punto 6

 Prueba 1: Tomar una muestra de 15 tanques, si hay uno o menos tanques defectuosos no se
rechaza la hipótesis nula.

 Prueba 2: Tomar una muestra de 17 tanques, si hay dos o menos tanques defectuosos no se
rechaza la hipótesis nula.

 Prueba 3: Tomar tanques al azar de manera sucesiva, si el número de tanques revisados hasta
encontrar el segundo tanque defectuoso es superior a 5, se rechaza la hipótesis nula

H0 : El lote no es defectuoso (p ≤ 0,05) H1 : El lote es defectuoso (p > 0,05)

a) Para error Tipo I ()


Prueba 1
X: Numero de tanques defectuosos en la muestra de 15 tanques

17
Prueba 1~Distribución Binomial (n=15, p=0.05)
= probabilidad de error tipo 1 P(x>1)
1 − 𝑃(𝑥 = 0) − 𝑃(𝑥 = 1)
15 15
= 1 − ( ) (0.050 )(1 − 0.05)15 − ( ) (0.051 )(1 − 0.05)14
0 1
=> 0.171.
Prueba 2
X: Numero de tanques defectuosos en la muestra de 17 tanques
Prueba 2~Distribución Binomial (n=17 p=0.05)
= probabilidad de error tipo 1 P(x>2)
1 − 𝑃(𝑥 = 0) − 𝑃(𝑥 = 1) − 𝑃(𝑥 = 2)
17 17 17
= 1 − ( ) (0.050 )(1 − 0.05)15 − ( ) (0.051 )(1 − 0.05)16 − ( ) (0.052 )(0.95)15
0 1 2
=> 0.050

Prueba 3
X: Numero de tanques revisados hasta encontrar el segundo defectuoso
Prueba 3~Distribución Binomial Negativa (k=2, p=0.05)
= probabilidad de error tipo 1 P(x>5)
5
𝑥−1
= 1 − 𝑃(𝑥 ≤ 5) => 1 − ∑ ( ) (1 − 0.05)2 (0.05)𝑥−2 = 0.978
1
𝑥=2

b) Error tipo 2(β)

Prueba 1
X: Numero de tanques defectuosos en la muestra de 15 tanques
Prueba 1~Distribución Binomial (n=15, p=0.1)
β= probabilidad de error tipo 2 P(x ≤ 1)
= P(x=0) + P(x=1)
15 15
= ( ) (0.1)0 (1 − 0.1)15 + ( ) (0.1)1 (1 − 0.1)14 = 0.549
0 1

Se calcula la potencia de prueba de hipótesis 1 − 𝛽 = 0.451

Prueba 2
X: Numero de tanques defectuosos en la muestra de 17 tanques
Prueba 2~Distribución Binomial (n=17, p=0.1)
β= probabilidad de error tipo 2 P(x ≤ 2)
17 17 17
= ( ) (0.1)0 (1 − 0.1)17 + ( ) (0.1)1 (1 − 0.1)16 + ( ) (0.1)2 (1 − 0.1)15
0 1 2
=> 0.762

18
Se calcula la potencia de prueba de la hipótesis 1 − 𝛽 = 0.238

Prueba 3
X: Numero de tanques revisados hasta encontrar el segundo defectuoso
Prueba 3~Distribución Binomial (K=2, p=0.1)
β= probabilidad de error tipo 2 P(x ≤ 5)
5
𝑥−1
= ∑( ) (1 − 0.1)2 (0.1)𝑥−2 = 0.0682
1
𝑥=2

Se calcula la potencia de prueba de la hipótesis 1 − 𝛽 = 0.932

c) En este caso se debe de seleccionar la prueba 2 ya que su probabilidad de error tipo 1 es


de 0.05 cumpliendo con el parámetro de obtención de un error máximo de 0.05 para el
error tipo 1.

Punto 7.

Primero se procede a organizar los datos en Excel y hallar un resumen de datos estadísticos para
tener todo lo necesario para resolver el problema.

Media 90,2166667
Error típico 0,26850691
Mediana 90,1
Moda 90,1
Desviación estándar 0,93013521
Varianza de la muestra 0,86515152
Curtosis 1,85139189
Coeficiente de
asimetría 1,14283518
Rango 3,5

19
Mínimo 88,9
Máximo 92,4
Suma 1082,6
Cuenta 12

a) Para comprobar que la afirmación del restaurante respecto a su calidad promedio con
una significancia de 1% se resuelven los siguientes pasos:
i. Plantee la prueba de hipótesis.

𝐻0 : 𝜇 ≥ 90
𝐻1 : 𝜇 < 90

ii. Identifique el estadístico de prueba con su distribución y calcúlelo.

𝑆 = 0.930
𝑋 = 90.217
𝐻0 = 𝑉𝐸𝑅𝐷𝐴𝐷 = 𝜇

𝑋−𝜇
~𝑡(𝑛−1) = 𝐸𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑜 𝑑𝑒 𝑝𝑟𝑢𝑒𝑏𝑎
𝑆 /√𝑛

90.217 − 90
= 0.808
0.930
√12

iii. Grafique la distribución del estadístico de prueba, identifique la región crítica


y el punto crítico. Adicionalmente, ubique el valor del estadístico de prueba.

𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑠𝑖 𝐸𝑃 < 𝑡(0.1;11)

𝑡(0.01;12−1) = −2.718

𝐸𝑃 < 𝑡(0.1;11) = 0.808 > −2.718

Presenta una distribución t suden con 11 grados de probabilidad de 1-0.01


El valor de la expresión 𝑡(0.1;11) se calculó con la fórmula de Excel
=INV.T(0,01;12-1)

20
Figura 4. Distribución t studen para el caso
vi. Concluya en términos del problema y del p - value.

Como se puede evidenciar en la gráfica el estadístico de prueba está fuera de la


región critica, por lo que no existe suficiente evidencia estadística para negar la
hipótesis nula del caso, es decir no hay evidencia que permita negar el hecho de que
el restaurante cuenta con una calidad promedio mayor a 90, esto también se puede
demostrar por medio del p-value

90.217 − 90
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 𝑃(𝑊 < 90) => 𝑃 (𝑊 < ) = 𝑃(𝑊 < 0.808) = 0.783
0.930
√12
Debido a que el p-value dio mayor que el nivel de significancia del 1% se llega a la
conclusión de que no existe suficiente evidencia para rechazar Ho.

b)
i. Prueba de hipótesis
𝐻𝑜 : 𝜎 2 = 0.5
𝐻𝐴 : 𝜎 2 < 0.5

ii. Estadístico de Prueba


Como se pide hacer una prueba de hipótesis para la varianza, se debe de utilizar el
siguiente estadístico de prueba:

𝑆2 0.8651
𝐸𝑃 = (𝑛 − 1) = (12 − 1) = 19.033
𝑎 0.5
2
𝐸𝑃 ~ 𝑋11
El estadístico de prueba sigue una distribución Chi Cuadrado con parámetro
11 que son sus grados de libertad.

21
iii. Grafique la distribución del estadístico de prueba, identifique la región crítica
y el punto crítico. Adicionalmente, ubique el valor del estadístico de prueba.
Se utiliza la siguiente fórmula para determinar el valor de la
expresión 𝑋 2 (0.05;12−1) , la cual me representa la región critica, en Excel
=INV.CHICUAD(0,05;12-1)=4.575

Figura 5. Distribución Chi-Cuadrado para el caso

vii. Concluya en términos del problema y del p - value.

Debido a que el estadístico de prueba se encuentra fuera del intervalo de rechazo se


puede concluir que no existe suficiente evidencia estadística para rechazar Ho, es decir
que no existe suficiente evidencia estadística para rechazar con un nivel de significancia
del 5% que la varianza de la calidad del servicio del restaurante es mayor a 0.05.
Concluyendo por medio del p-value
0.8651
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 𝑃(𝑆 2 < 0.5) => 𝑃 (𝑆 2 < (12 − 1))
0.5
=> 𝑃(𝑆 2 < 19.033) => 𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0.939
Para el cálculo del p-value se utilizó la fórmula de Excel
DISTR.CHICUAD(19,033;12-1;VERDADERO)

22
Se puede ver a su vez que el p-value es mayor a la significancia, por lo que llegamos a
la misma conclusión de que no existe suficiente evidencia estadística para rechazar
Ho en un nivel de significancia del 5%.

23

También podría gustarte