Está en la página 1de 16

Taller 3

Iván G. Molina Perilla (20202191032)

Dimitry A. Riascos Malaver (20202191038)

Miguel Á. Pinzón Pinzón (20202191059)

Especialización en Estadística, Universidad Surcolombiana

Inferencia Estadística

Mg. Alfonso Sánchez Hernández

4 de Diciembre, 2020

1
Consultas de clase
a) Varianza V(x) de la distribución t-student

z
X= t( k )
U
k√
Para una normal estándar tenemos E(z)= 0 y V(z)= 1

z
E ( x )=E
[√ ]
u
k
, como z y u son independientes

1 1
E ( z )∗E
[√ ] [√ ]
u
k
=0∗E
u
k

E ( x )=0
Luego tenemos que
V ( x )=E ( X 2 )

z2
E ( X 2) =E
[]
u
k
, como z y u son independientes

1 1∗k k

[]
2
E ( z )∗E = =
u 1 E ( U −1 )
k
E
u ()
Recordemos que una variable t es definida con términos de una normal estándar y
chi cuadrado variable u con k grados de libertad. Partimos que E ( U n ) si U es chi
cuadrado.
Una función gamma si n+k/2 > 0

E (U n )=
( k2 )
2 n Ґ n+

k
Ґ( )
2
sin=−1 y cumpliendo propiedad que Ґ ( a+1 )=aҐ ( a )
2
−1
E (U )=
( k2 ) = 2 = 1 ; si k >2
2−1 Ґ −1+ −1

k k k −2
Ґ( ) −1
2 2

k
Luego V ( x )=
k−2

b) Si X ~ F(m,n), encuentre E(x) y V(x)

U
m
X= F (m, n)
V
n

U
∗n
V
X= F( m, n)
m

n
E ( x )=E[ ]
m
∗U
V
n
= ∗E
m
U
V
n
= ∗E
m
U∗1
V
n
[ ] [ ]
= ∗E [ U ]∗E
m
1
V [ ]
n 1 1 n∗1
m
∗m∗E
V
=n E
V[ ] [ ]
=
n−2

n
E ( x )=
n−2
2
V ( x )=E ( x 2) −[ E(x ) ]

n2

[ ]
E ( x 2 )=E
m2
∗U 2

V2
=
n2
m2
∗E
U2
=
n2
V 2 m2 [ ]
∗E
U 2∗1
V2 [ ]
n2 1
¿
m2
∗E [ U 2 ]∗E 2
V [ ]

3
c) Que pasa si quiero comparar las medias de dos poblaciones normales, en donde no
se conocen las varianzas y tampoco puedo suponer que dichas varianzas son iguales
(Smith -Sattherwaite)

Primero se debe realizar un estadístico F para probar la igualdad de dos


varianzas y así probar la diferencia entre las varianzas de dos poblaciones
por medio de la razón de las varianzas de las muestras. Nota: En el
ejercicio 3 se realiza este procedimiento.
Si se llega a la conclusión que las varianzas poblacionales son distintas, la
prueba t de varianza conjunta es inapropiada. En este caso, es más
conveniente utilizar la prueba t de varianza separada desarrollada por
Satterthwaite. En el procedimiento de aproximación de Satterthwaite, se
incluyen las dos varianzas de la muestra separada en el cálculo del
estadístico de prueba t; de ahí el nombre de prueba t de varianza
separada. Como los cálculos para la prueba t de varianza separada son
complicados, es recomendable usar Excel o algún software estadístico
para realizarlo.

UNIVERSIDAD SUR COLOMBIANA - USCO


FACULTAD DE CIENCIAS
PROGRAMA DE ESPECIALIZACIÓN EN ESTADÍSTICA

Taller 3 Inferencia Estadística - 29 de Noviembre de 2020

1. Intente calcular el estimador de máxima verosimilitud para la distribución


geométrica. Recuerde que su función de densidad discreta es f (x) = px q I{0,1,2,3,···}(x).
R/

L ( p )= p ( 1− p )x −1 … p ( 1− p )x −1
1 n

n n
p n
pn ( 1− p ) ∑ xi ( 1− p ) =
i=1
−n
( 1− p ) (1− p) ∑ x i
n
i =1
n
p
( )
ln ( L ( p ) )=nln
1− p
+ ln (1− p ) ∑ xi =nln ( p )−nln(1−p)+ ln ( 1− p ) ∑ x i
i=1
n
i=1
d n n 1
dp
( ln ( L ( p ) ) )= p + 1− p − 1− p ∑ xi =0
i=1
n
n 1
=
p 1−p (
−n+ ∑ x i
i=1
)

4
n
1
1− p= p ∑ x i−1
n i=1 ( )n
1
1= p+ p (∑)
n i=1
xi − p

n
^p= n

∑ xi
i=1
2 n
d −n n 1
2(
ln ( L ( p ) ) )= 2 + − ∑ xi
p ( 1− p ) ( 1−p )2 i=1
2
dp
Si la segunda derivada es negativa, el punto crítico hallado en la primera derivada es un
máximo, como en este caso.

2. Los datos extraídos de 5 poblaciones son resumidos en la siguiente tabla

Tamaño de n 6 4 3 7 8
muestra i
Varianza s 4 3 2 4 5
muestral i2 0 0 0 2 0
Cuadro 1: Fuente: Mood, Graybill y Boes, pp.

399 Se pide calcular la varianza combinada o varianza


p pool

S2.

R/

( n 1−1 ) S 12 + ( n 2−1 ) S 22+ ( n3−1 ) S 3 2+ ( n 4−1 ) S 4 2 + ( n 5−1 ) S 52


S2 P=
n 1+ n 2+ n 3+n 4 +n 5−5

( 6−1 ) 40+ ( 4−1 ) 30+ ( 3−1 ) 20+ ( 7−1 ) 42+ ( 8−1 ) 50


S2 P=
6+ 4+3+7 +8−5

S2 P=40.52

3. Para ensayar nuevas variedades de maíz, bajo condiciones normales, una compañía de
semillas seleccionó aleatoriamente 8 fincas, cultivó en cada una de ellas dos
variedades experimentales. La producción en toneladas por hectárea fue´:

5
Varieda 8 8 5 9 8 9 7 7
dA 6 7 6 3 4 3 5 9
Variedad 8 7 5 9 7 8 7 6
B 0 9 8 1 7 2 4 6
Cuadro 2: Producción en Toneladas por Hectárea

Asuma que las dos poblaciones son normales y calcule un intervalo de confianza al
95 % para la diferencia de las dos medias poblacionales de las dos variedades µ1 −
µ2.

R/
Calculamos en Excel la media y la desviación estándar muestral.
Media Desviación estándar
Variedad A 81,625 12,0704
Variedad B 75,875 10,1057

Calculando el estadístico F
12,07042
F= =1,427 GLN =8 GLD=8
10,10572
F critico superior =4,43
F criticoinferior =0,2257
Como el estadístico F está entre el valor critico superior e inferior, no rechazamos la
hipótesis nula, por tanto, podemos asumir varianzas iguales.

7∗( 12,0704 )2 +7∗( 10,1057 )2


s2p= =123,9
7+7
t 0,05 ;14 GL=2,145

μ1−μ 2=( 81.625−75.875 ) ± 2.145 123.9


√ ( 18 + 18 )

[ ( 81.625−75.875 ) −2.145 123.9 ( 18 + 18 ) ; ( 81.625−75.875) +2.145 √ 123.9( 18 + 18 )]
[−6.188 ; 17.69]

4. Los siguientes datos, (Walpole y Myers, pp. 286), representan las mediciones del
tiempo de secado de cierta marca de pintura látex.

3. 2. 4. 2 3
4 5 8 . .
9 6
2. 3. 5. 3 2
8 3 6 . .

6
7 8
4. 4. 5. 3 4
4 0 2 . .
0 8
Cuadro 3: Ejercicio 9.18

Suponiendo que las mediciones representan una muestra aleatoria de una población
normal, encuentre un intervalo de confianza del 99 % para la media poblacional del
tiempo de secado.

R/ n=15 ; x́=3.787 ; s=0.971 ; α =0.01 ; 1−α =0.99


(media y desviación estándar calculada con sofware R)

tα ∗S
, ( n−1)
2
μ ϵ [ x́ n ± ]
√n
t 0.01 ∗0.971
, ( 15−1 )
2
[3.787 ± ]
√ 15
¿

2.977∗0.971 2.977∗0.971
[3.787− ; 3.787+ ]
√ 15 √ 15
[3.041; 4.533]

Con una confianza del 99% la media poblacional µ del tiempo de secado puede estar
entre 3.041 y 4.533

5. Los siguientes datos, Dodge y Birkes (1993, pp. 7), representan el porcentaje de
nacimientos (Y ) y el porcentaje urbano (X), en paises de Centro y Norte América

7
Pais yi xi
Canadá 1 5
6. 5
2
Costa Rica 3 27.
0. 3
5
Cuba 1 33.
6. 3
9
Rep. 3 37.
Dominicana 3. 1
1
El Salvador 4 11.
0. 5
2
Guatemala 3 14.
8. 2
4
Haiti 4 13.
1. 9
3
Honduras 4 1
3. 9
9
Jamaica 2 33.
8. 1
3
Mexico 3 43.
3. 2
9
Nicaragua 4 28.
4. 5
2
Panamá 2 37.
8 7
Trinidad/Tob 2 6.
ago 4. 8
6
EEUA 1 56.
6 5

Proponga un modelo de regresión lineal, y dibuje el diagrama de puntos.

R/
50

45

40

35

30

25

20

15

10

0
0 10 20 30 40 50 60

Calcule la regresión por mínimos cuadrados, y dibuje la curva estimada.

Pais xi yi X^2 Y^2 XY X-Xp Y-Yp (X-Xp)^2 (Y-Yp)^2 (X-Xp)(Y-Yp)

Canadá 55 16,2 3025 262,44 891 25,2071429 -14,9071429 635,400051 222,222908 -375,7664796
Costa Rica 27,3 30,5 745,29 930,25 832,65 -2,49285714 -0,60714286 6,21433673 0,36862245 1,513520408
Cuba 33,3 16,9 1108,89 285,61 562,77 3,50714286 -14,2071429 12,300051 201,842908 -49,82647959
Rep.
37,1 33,1 1376,41 1095,61 1228,01 7,30714286 1,99285714 53,3943367 3,97147959 14,56209184
Dominicana
El Salvador 11,5 40,2 132,25 1616,04 462,3 -18,2928571 9,09285714 334,628622 82,680051 -166,3343367
Guatemala 14,2 38,4 201,64 1474,56 545,28 -15,5928571 7,29285714 243,137194 53,1857653 -113,7164796
Haiti 13,9 41,3 193,21 1705,69 574,07 -15,8928571 10,1928571 252,582908 103,894337 -161,9936224
Honduras 19 43,9 361 1927,21 834,1 -10,7928571 12,7928571 116,485765 163,657194 -138,0714796
Jamaica 33,1 28,3 1095,61 800,89 936,73 3,30714286 -2,80714286 10,9371939 7,88005102 -9,283622449
Mexico 43,2 33,9 1866,24 1149,21 1464,48 13,4071429 2,79285714 179,75148 7,80005102 37,44423469
Nicaragua 28,5 44,2 812,25 1953,64 1259,7 -1,29285714 13,0928571 1,67147959 171,422908 -16,92719388
Panamá 37,7 28 1421,29 784 1055,6 7,90714286 -3,10714286 62,5229082 9,65433673 -24,56862245
Trinidad/Tob
6,8 24,6 46,24 605,16 167,28 -22,9928571 -6,50714286 528,67148 42,3429082 149,6178061
ago
EEUA 56,5 16 3192,25 256 904 26,7071429 -15,1071429 713,27148 228,225765 -403,4686224
Sumatoria 417,1 435,5 15577,57 14846,31 11717,97 3,5527E-14 0 3150,96929 1299,14929 -1256,819286

n 14
Xp 29,79285714
Yp 31,10714286
m -0,39886751
b 42,99054572
Realice la estimación de mínimos cuadrados, sin tener en cuenta Trinidad/Tobago.
Pais xi yi X^2 Y^2 XY X-Xp Y-Yp (X-Xp)^2 (Y-Yp)^2 (X-Xp)(Y-Yp)
Canadá 55 16,2 3025 262,44 891 23,4384615 -15,4076923 549,361479 237,396982 -361,1326036
Costa Rica 27,3 30,5 745,29 930,25 832,65 -4,26153846 -1,10769231 18,1607101 1,22698225 4,720473373
Cuba 33,3 16,9 1108,89 285,61 562,77 1,73846154 -14,7076923 3,02224852 216,316213 -25,5687574
Rep.
37,1 33,1 1376,41 1095,61 1228,01 5,53846154 1,49230769 30,6745562 2,22698225 8,265088757
Dominicana
El Salvador 11,5 40,2 132,25 1616,04 462,3 -20,0615385 8,59230769 402,465325 73,8277515 -172,3749112
Guatemala 14,2 38,4 201,64 1474,56 545,28 -17,3615385 6,79230769 301,423018 46,1354438 -117,9249112
Haiti 13,9 41,3 193,21 1705,69 574,07 -17,6615385 9,69230769 311,929941 93,9408284 -171,1810651
Honduras 19 43,9 361 1927,21 834,1 -12,5615385 12,2923077 157,792249 151,100828 -154,4102959
Jamaica 33,1 28,3 1095,61 800,89 936,73 1,53846154 -3,30769231 2,36686391 10,9408284 -5,088757396
Mexico 43,2 33,9 1866,24 1149,21 1464,48 11,6384615 2,29230769 135,453787 5,25467456 26,67893491
Nicaragua 28,5 44,2 812,25 1953,64 1259,7 -3,06153846 12,5923077 9,37301775 158,566213 -38,55183432
Panamá 37,7 28 1421,29 784 1055,6 6,13846154 -3,60769231 37,6807101 13,0154438 -22,14568047
EEUA 56,5 16 3192,25 256 904 24,9384615 -15,6076923 621,926864 243,600059 -389,2318343
Sumatoria 410,3 410,9 15531,33 14241,15 11550,69 5,6843E-14 0 2581,63077 1253,54923 -1417,946154

n 13
Xp 31,56153846
Yp 31,60769231
m -0,54924437
b 48,94268947
Interprete adecuadamente los resultados.
Los coeficientes de determinación en ambos casos son bajos, pero la regresión muestra
una clara relación inversa entre el porcentaje de nacimientos (Y ) y el porcentaje urbano
(X). También observamos que la regresión por mínimos cuadrados es bastante sensible a
datos atípicos, como lo era Trinidad/Tobado, esto no quiere decir que debamos
eliminarlos, si no que debemos encontrar la raíz de porque se tienen esos datos atípicos,
como Nicaragua y Cuba, entre otros más.

Nota: Utilice Excel.

6. Calcule un intervalo de confianza del 98 % para la proporción de artículos


defectuosos, en un proceso, cuando se encuentra que en una muestra de tamaño 100,
se encuentren 8 defectuosos.
R/ n=100 ; α =0.02; 1−α =0.98 ; ^p =0.08

^p (1− ^p )
^p ± Z α ∗
2 √ n

0.08(1−0.08)
0.08 ± Z 0.02∗
2 √ 100
0.08(1−0.08)
0.08 ± 2.326∗
√ 100

0.08 ( 1−0.08 ) 0.08(1−0.08)


0.08−2.326∗
√ 100 √
; 0.08+2.326∗
100

[0.0169; 0.143]

Con una confianza del 98% la proporción de artículos defectuosos estaría comprendida
entre 1.69% y 14.3%

7. Los pesos en decagramos de 10 paquetes de semilla para césped que vende cierto
almacén son; 46.4, 46.1, 45.8, 47, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un
intervalo de confianza del 95 % para la varianza de la población σ2 de paquetes de
se- millas para césped.

R/
Calculamos en Excel la varianza muestral

n 10
Varianza 0,2862

Calculamos los valores de chi cuadrado para los límites del intervalo de confianza
X 20,025 ;9=19,0228
X 20,975 ;9=2,7004

( 10−1 )∗0,2862/19,0228<σ 2 < ( 10−1 )∗0,2862 /2,7004


0,1354< σ 2 <0,9539

8. Un fabricante de equipos deportivos desarrolló un nuevo sedal sintético para


pesca. El fabricante afirma que el sedal tiene una resistencia media a la rotura de
8 kilogramos, con una desviación estándar de 0,5 kilogramos. Pruebe la hipótesis
de que H0 : µ = 8, versus la hipótesis
ƒ alternativa Ha : µ ≠ 8, si una muestra de 50
sedales arrojó una media muestral de x́ = 7,8 kilogramos, use un nivel de
significancia de 0,01.

R/ H0 : µ = 8 ; Ha : µ ≠ 8 ; α=0.01

Calculamos estadístico de prueba


x́−μ 7.8−8
z= =
σ 0.5
√n √50
z=−2.83

α 0.01
Con un nivel de significancia de 0.01, calculamos el cuantil, = =0.005
2 2
z=−2.575
Como−2.83←2.57 se rechaza H 0 , la resistencia media a larotura no es igual a 8 kg

9. En una pequeña ciudad dentro de un departamento de Colombia, se pretende


com- parar la diferencia entre las personas que están a favor de un proyecto, que
favorecería tanto al departamento como a la ciudad. Si 120 de los 200 habitantes de
la ciudad están a favor del proyecto, y 240 de los 500 habitantes del departamento,
están a favor del proyecto. Calcule un intervalo de confianza al 95 % para la
diferencia poblacional de las proporciones Pc – Pd
R/ α =0.05 ; 1−α=0.95; Z α =1.96
2

120+240
ṕ= =0.5143
200+500
120
p1 = =0.6
200
240
p2= =0.48
500

2 √
π c + π d= p1 −p 2 ± Z α ∗ ṕ ( 1− ṕ )
( n1 + n1 )
1 2


π c + π d=0.6−0.48 ± 1.96∗ 0.5143 ( 1−0.5143 ) ( 2001 + 5001 )

0.6−0.48−1.96∗ 0.5143 ( 1−0.5143 ) ( 2001 + 5001 ) ; 0.6−0.48−1.96∗√ 0.5143 (1−0.5143) ( 2001 + 5001 )
[0.038 ; 0.202]
10. Para el ejercicio 9 pruebe la hipótesis H0 : Pc = Pd

R/ calculamos estadístico de prueba para las proporciones


^ c −P
P ^d
Z=
σ ^P −P^
c d

En el denominador se utilizará la proporción combinada. Se asume que la hipótesis nula es


verdadera, no hay diferencias en las proporciones de ciudad y el departamento
120+240
P combinada=
^ =0.51
200+500

120 240

200 500
Z=
0.51(1−0.51) 0.51(1−0.51)
√ 200
+
500

120 240

200 500
Z=
0.51(1−0.51) 0.51(1−0.51)
√ 200
+
500

Z=2.87
α 0.05
Con un nivel de confianza del 95%, calculamos el cuantil, = =0.025
2 2
z=1.96
Como 2.87 > 1.96 se rechaza H0. Las proporciones de la población de la ciudad y el
departamento que están a favor del proyecto no son iguales

También podría gustarte