Está en la página 1de 143

EE517-1453-INFERENCIA ESTADÍSTICA

SEMANA 1
EE517-1453-INFERENCIA ESTADÍSTICA

VARIABLE ALEATORIA

Definición.
Una variable aleatoria X, es una función cuyo dominio es el espacio muestral
Ω y su rango o recorrido es un subconjunto no vacío de números reales, tal que
para cada uno de los elementos w ∈ Ω se le asocie un número real x = X (w).

⊏ IR

𝑤2 𝑥2

Dom(X)=Ω Ran(X)=A

Observaciones.
1. Notación de variable aleatoria:
[𝑋(𝑤) = 𝑥 ]= [𝑋 = 𝑥 ]
Variable aleatoria: X, Y, Z, W, etc.
Número Real: x, y, z, etc.

2. Elespacio muestral no siempre está formado por puntos muestrales numéricos;


sino en muchos casos son entes abstractos (artículos defectuosos o no defectuosos,
etc.). En estos casos, es necesario asignar un valor numérico x ϵ ℝ, a cada evento
elemental w ϵ Ω; es decir, cuantificar los eventos.

Ejemplo N°1.
Sea el experimento aleatorio ϵ: lanzar una moneda dos veces y observar en cada
caso la “cara” superior.

El espacio muestral es Ω = {(s, s), (s, c), (c, s), (c, c)}

Variable aleatoria X: número de caras que se obtienen.

Dom(X) = Ω Ran(X)= { 0, 1, 2, }

X (s, s) =X (𝑤1 )=0, (s, c) =X (𝑤2 )=1, X (c, s) =X (𝑤3 )=1, X (c, c) =X (𝑤4 )=2
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA

DISTRIBUCIONES IMPORTANTES
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA

SEMANA 2
EE517-1453-INFERENCIA ESTADÍSTICA

INFERENCIA ESTADISTICA
Es la que nos proporciona la teoría necesaria para poder inferir o estimar las leyes de una
población partiendo de resultados o conclusiones del análisis de una muestra.
POBLACION. - Es el conjunto de todas las observaciones o resultados posibles que pueda
tomar una variable aleatoria X.

- X : Peso de los estudiantes de la UNAC (Kg.)

X ~ N (60,3)

- Y : Situación laboral de un estudiante

0 , 𝑛𝑜 𝑡𝑟𝑎𝑏𝑎𝑗𝑎
Y={
1, 𝑡𝑟𝑎𝑏𝑎𝑗𝑎
Y ~ b (15,000, 0.6)

MUESTRA. - Subconjunto de la población (𝑥1 , 𝑥2 , 𝑥3 ……𝑥𝑛 )

Muestra Aleatoria. - Es una sucesión finita de variables aleatorias independientes e


idénticamente distribuidas, estas condiciones ocurren si el muestreo se realiza en una población
infinita o con reemplazamiento de una población finita.

Además, si X es la población con:

𝐸(𝑋) = 𝜇 y 𝑉(𝑋) = 𝜎 2 , entonces:

i) 𝐸(𝑋𝑖 )= 𝜇 = 𝐸(𝑋) ∀ 𝑖 = 1,2,3, … … . 𝑛

ii) 𝑉(𝑋𝑖 )= 𝜎 2 , = 𝑉(𝑋) ∀ 𝑖 = 1,2,3, … … . 𝑛

FUNCION DE PROBABILIDAD CONJUNTA DE UNA MUESTRA ALEATORIA

𝑃(𝑥1 , 𝑥2 , 𝑥3 , … . . 𝑥𝑛 , ) = 𝑃(𝑥1 ).𝑃(𝑥2 ). 𝑃(𝑥3 )…… 𝑃(𝑥𝑛 )

= 𝑃(𝑥𝑖 )

𝑥𝑖 ∶ 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝐴𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝐷𝑖𝑠𝑐𝑟𝑒𝑡𝑎


FUNCION DE DENSIDAD PROBABILIDAD CONJUNTA DE UNA MUESTRA ALEATORIA

𝑓(𝑥1 , 𝑥2 , 𝑥3 , … . . 𝑥𝑛 , ) = 𝑓(𝑥1 ). 𝑓(𝑥2 ). 𝑓(𝑥3 )….. 𝑓(𝑥𝑛 )

= 𝑓(𝑥𝑖 )

𝑥𝑖 ∶ 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝐴𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝐶𝑜𝑛𝑡𝑖𝑛𝑢𝑎


EE517-1453-INFERENCIA ESTADÍSTICA

Ejemplo:

Suponga que los pesos de los estudiantes de la UNAC es una variable aleatoria X que tiene
desviación normal con 𝑥̅ = 65, 𝜎 2 = 16, si se selecciona una muestra aleatoria de 20 estudiantes
y se registra el peso de cada uno de ellos; calcular:

a) P (𝑥1 − 𝑥5 + 𝑥7 + 𝑥15 − 𝑥19 ≥70)


b) ¿Cuál es la probabilidad que el peso total de los 20 estudiantes exceda a 1350kg?
c) Hallar la función de densidad conjunta de la muestra aleatoria

Solución

𝑋 : Peso de un estudiante de la UNAC (kg).

𝑥1 : Peso del primer estudiante de la muestra.

. .
. .
. .
𝑥5 : Peso del quinto estudiante de la muestra

X ~ N (65,16)

m.a. (𝑥1 , 𝑥2 , 𝑥3 … . . 𝑥20 )

a)

𝑥1 − 𝑥5 + 𝑥7 + 𝑥15 − 𝑥19 ~ N (65,80)

𝐸(𝑥1 − 𝑥5 + 𝑥7 + 𝑥15 − 𝑥19 )= 𝐸(𝑥1 ) - 𝐸(𝑥5 ) + 𝐸(𝑥7 ) + 𝐸(𝑥15 ) - 𝐸(𝑥19 )

= 65 - 65 + 65 + 65 - 65 = 65

𝑉(𝑥1 − 𝑥5 + 𝑥7 + 𝑥15 − 𝑥19 )= 𝑉(𝑥1 ) +(−1)2 𝑉(𝑥5 ) + 𝑉(𝑥7 ) + 𝑉(𝑥15 )+ (−1)2 𝑉(𝑥19 )

= 80

Sea

T = 𝑥1 − 𝑥5 + 𝑥7 + 𝑥15 − 𝑥19

T ~ N (65,80)
𝑇−𝜇 70−µ𝑇 70−65
P (T ≥ 70) = P ( ≥ ) = P(Z≥ )
𝜎𝑇 𝜎𝑇 √80

= P (Z ≥ 0.55902)

P (T ≥ 70) =

b) W = 𝑥1 + 𝑥2 +𝑥3 ………𝑥20

W ~ N [20(65), 20(16)]

𝐸(𝑤)= 𝐸(𝑥1 + 𝑥2 + 𝑥3 … … … 𝑥20 )=20(65) = 1 300

𝑉(𝑤)= 𝑉(𝑥1 + 𝑥2 + 𝑥3 … … … 𝑥20 )=20(16) = 320


EE517-1453-INFERENCIA ESTADÍSTICA

P (W > 1350) = 1 – P (W ≤ 1350)


𝑊−1300 1350−1300
=1–P( ≤ )
√320 √320
50
= 1 – P (𝑍 ≤ )
17.888

= 1 – P (𝑍 ≤2.79508)

P (W > 1350) = 1 –

Utilizar la interpolación

Z P

2.79 0.99736
-
- - 2.79508 X -
2.80 0.99744
2.79508 − 2.79 𝑋 − 0.99736
=
2.80−2.79 0.99744−0.99736

La probabilidad hallada es ……………

c) 𝑓(𝑥1 , 𝑥2 , 𝑥3 , … . . 𝑥20 , )= 𝑓(𝑥𝑖 )

1 𝑥−𝜇 2
1
𝑓(𝑥) = 𝑒 −2( 𝜎
)
√2𝜋𝜎

1 𝑥−𝜇 2
1
= ( 𝑒 − 2(𝜎
) 20
)
√2𝜋𝜎

OTROS EJEMPLOS

Sea 1 primero gana en el 𝑖 = 1,2,3 … . .20 día


𝑥𝑖 =
0 primero pierde en el 𝑖 = 1,2,3 … . .20 día

Y: Número Total de veces que el primero ganó en los 20 días

Probabilidad de ganar cada día = 1/2

a) P (𝑦 ≥ 10)

𝑦= 𝑥𝑖 ~ B(1 ,1/2)
∀ 𝑖 = 1,2,3, … … .20

𝑦 ~ b(20 ,1/2)
EE517-1453-INFERENCIA ESTADÍSTICA

P (𝑦 ≥ 10) = P (𝑦 = 10) + P (𝑦 = 11) + …………………+ P (𝑦 = 20)


1 1 1 1 1 1
P (𝑦 ≥ 10) =(20
10
)( )10 . ( )10 + (20
11
)( )11 . ( )9 + …………………….(20
20
)( )20 . ( )0
2 2 2 2 2 2

= 0.583

P (𝑦 ≤ 15) = 1 - P (𝑦 ≥ 16)……………………………… Ver tabla

= 1 – 0.006

Hallar la función de probabilidad conjunta de una población de Poisson de donde se


tiene una muestra aleatoria de tamaño 3.

Sea (𝑥1 , 𝑥2 , 𝑥3 ) m.a.


3
𝑒 −𝜆 .𝜆𝑥1 𝑒 −𝜆 .𝜆𝑥2 𝑒 −𝜆 .𝜆𝑥3
𝑃(𝑥1 , 𝑥2 , 𝑥3 ) = 𝑃(𝑥𝑖 )= ( ).( ).( )
𝑥1 ! 𝑥2 ! 𝑥3 !

Ejercicios

- Sea X: Duración (horas) de un foco

X ~ N(1000 ,1002)
m.a. (𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 ) Sea W=𝑥1 + 𝑥2 + 𝑥3 + 𝑥4

P (W> 10) = 1 – P (W≤10)


10−4000
= 1 – P (Z≤ ) = 1 – P (Z≤-19.95)
√40 000
𝑋
- Se tiene una m.a. de tamaño 2, cuya función de probabilidad de esta V.A. X es 𝑃𝑥 =
6
𝑥 = 1,2,3
Hallar:
𝐸(𝑥1 + 𝑥2 )=

𝑉(𝑥1 + 𝑥2 ) =
PARAMETRO. - Característica medible de una población que generalmente es desconocido y
se asume constante.

ESTADISTICO. – Una función que depende de una variable aleatoria, característica de una
muestra aleatoria.

𝑋𝑖 (𝑋𝑖 − 𝑋̅)2
𝑥𝑖 (𝑥𝑖 −𝑥̅ )
𝑋̅ = 𝑆2 =
𝑛 𝑛−1
N
𝑋𝑖
𝑥𝑖
𝜇 = media Poblacional =
𝑁

N
(𝑋𝑖 − 2𝜇)2
(𝑥𝑖 −𝜇)
𝜎2 =
𝑁
EE517-1453-INFERENCIA ESTADÍSTICA

EJERCICIOS

- Sea X una V.A. cuya función de densidad

𝑓(𝑥)= 6x(1-x) 0<x<1

Se extrae una muestra aleatoria 𝑥1 , 𝑥2 de esta población.

Calcular la media y la varianza de 𝑥1 + 𝑥2

- Sea 𝑥1 , 𝑥2 , 𝑥3 ,….. 𝑥50 V.A.I. cada una distribuida según la función de probabilidad:

1/2

1/4

0 1 2
Calcular 𝑃(𝑥1 + 𝑥2 + ⋯ + 𝑥50 > 55)

- Las calificaciones de un grupo de estudiantes de ingles están distribuidas normalmente


alrededor de una media 72 con una desviación típica de 9.
a) Encuentre la probabilidad de que un estudiante de ingles extraído al azar tenga una
calificación superior a 80
b) Si se selecciona una muestra aleatoria de 10 estudiantes ¿Cuál es la probabilidad de
que estos tengan una calificación promedio superior a 80? Si se conocen los valores
poblacionales
c) ¿Cuál sería el resultado si se desconoce el valor de la varianza poblacional

- Los depósitos en nuevo banco durante el mes de marzo último están normalmente
distribuidos con media de 5000 y una desviación estándar de 800 si se selecciona una m.a.
de 20 depósitos referentes al mes de marzo Calcular.

a) P (𝑋8 ≤ 6500)
b) ¿Cuál es la probabilidad de que la suma total de los 20 depósitos exceda a 90 000?
c) Halle la función de densidad conjunta de los depósitos
d) Suponga que un depósito que sobrepase los 7000 ingresa a un sorteo ¿Cuál es la
probabilidad de que ningún depósito en el grupo de los 20 ingrese en el sorteo?
e) Cuál es la probabilidad de que tres o más depósitos en el grupo de los 20 ingresen
al sorteo

- Se sabe con cierto procedimiento se fabrican focos cuyas duraciones están distribuidas por
lo general con una media de 200 horas y desviación estándar de 20 horas. Si se eligen al azar
3 de estos focos ¿Cuál es la probabilidad de que las 3 duraciones excedan de 195 horas?

- Suponga que determinados bulbos electrónicos tienen vidas medias que están distribuidas
exponencialmente con parámetro 𝜆. Si se toma una muestra aleatoria de 𝑛 de estos bulbos
EE517-1453-INFERENCIA ESTADÍSTICA

y se representa con 𝑥𝑖 la duración del i-ésimo bulbo i=1,2, 3… 𝑛 ¿Cuál es la función conjunta
de densidad de la muestra?
EE517-1453-INFERENCIA ESTADÍSTICA

- Suponga que X se distribuye uniformemente en el intervalo de 0 a 1, considere una m.a. de


tamaño 5 de X, ¿Cuál es la función de densidad conjunta de la muestra?

- Suponga que los pesos de los estudiantes universitarios están distribuidos uniformemente
si se toma una m.a. de 20 estudiantes y se registra el peso de cada uno. ¿Cuál es la función
de densidad conjunta para los pesos muestreados? En función de 𝜇 𝑦 𝜎 ¿Cuál es la
probabilidad de que el total de los pesos exceda 1000 libras?

- Se extraen bolas con reemplazamiento en una urna que contiene una bola blanca y dos
negras representemos por x=0 una bola blanca y por x=1 una bola negra. Para muestras 𝑥1 ,
𝑥2 , 𝑥3 ……𝑥9 de tamaño 9

a) ¿Cuál es la distribución conjunta de las observaciones?

b) ¿Y la distribución de la suma de las observaciones?

- ¿Cuál es la probabilidad de que las dos observaciones de una muestra de tamaño dos de una
población con distribución rectangular sobre el intervalo unitario, no difieran en más de un
medio?

- De una población normal con 𝜇 = 10 𝑦 𝜎 = 2 se extraerá una muestra aleatoria 𝑥1 , 𝑥2 ,


𝑥3 , 𝑥4 calcular:

A) P (𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 ≥ 48)

B) P (𝑥3 >13)

El proceso de seleccionar una muestra de n elementos se llama muestreo.


Existe dos tipos de muestras:

• Las NO PROBABILISTICAS
Basadas de acuerdo al criterio del experto

• Las PROBABILISTICAS O MUESTRAS ALEATORIAS

Son aquellas en que cada elemento de la población tiene una probabilidad


perfectamente conocida de ser incluida en la muestra.

Existen 4 tipos de muestras aleatorias:


- Al azar simple
- Al azar sistemático
- Al azar estratificado
- Al azar por grupos o conglomerados

TAREA
Investigar lo tipos de muestreo
EE517-1453-INFERENCIA ESTADÍSTICA

MOMENTOS
Sea 𝑥1 , 𝑥2 , 𝑥3 , … ., 𝑥𝑛 , un conjunto de 𝑛 observaciones de una característica
X, el momento de orden r con respecto a un punto a de la muestra.

1
𝑀𝑟,a = (𝑥𝑖 − 𝜇)r
𝑛

POBLACIONALES (PARÁMETROS)

MOMENTOS

MUESTRALES (ESTADISTICOS)

MOMENTO MUESTRALES

i) Alrededor del origen

Cuando las observaciones son calculadas con respecto al punto a= 0


1
𝑀r,a = (𝑥𝑖 )r r = 1,2,3 … ..
𝑛

1
Si: r=1 → 𝑀1,0 = 𝑛
(𝑥𝑖 ) = 𝑥̅
1
r=2 → 𝑀2,0= 𝑛
(𝑥𝑖 )2

ii) Alrededor de la media


1
𝑀𝑟,𝑥̅ = (𝑥𝑖 − 𝑥̅ )r r = 1,2,3 … ..
𝑛

1
Para: r=1 → 𝑀1,𝑥̅ = 𝑛
(𝑥𝑖 − 𝑥̅ ) = 0
1
r=2 → 𝑀2,𝑥̅ = 𝑛
(𝑥𝑖 − 𝑥̅ )2 =S2

MOMENTO POBLACIONALES

i) Alrededor del origen

𝑇r,0 = 1
𝑛
(𝑥𝑖 )r r = 1,2,3 … ..

𝑇𝑟,0 = E(𝑥 r) 𝑖 r = 1,2,3 … ..


1
Si: r = 1 → 𝑇1,0 = 𝑛
(𝑥𝑖 ) = E(X)= 𝜇

i) Alrededor de la media
EE517-1453-INFERENCIA ESTADÍSTICA

N
1
𝑇r,𝜇 = 𝑁
(𝑥𝑖 − 𝜇)𝑟 r = 1,2,3 … ..

= 𝐸 (𝑥𝑖 − 𝜇)r r = 1,2,3 … ..


N
1
Si: r= 1 → 𝑇1,𝜇 = 𝑁
(𝑥𝑖 − 𝜇) =E (𝑥𝑖 − 𝜇)
N
1
r=2 → 𝑇2,𝜇 = 𝑁
(𝑥𝑖 − 𝜇)2 = E [(𝑥𝑖 − 𝜇)2 ] = 𝜎 2

Ejemplo

Se va a realizar un viaje en automóvil de acuerdo con experiencias anteriores al hacer este viaje
puede suponerse que el tiempo de llegada toma entre 20 y 30 minutos

Si X representa los minutos necesarios para llegar, Hallar:

a) r − ésimo momento alrededor del origen.


b) Si r=1 alrededor del origen.
c) Si r=2 alrededor del origen.

Solución:

a- X: Tiempo en minutos necesarios para llegar

1⁄ 20 < x < 30
𝑓(𝑥) = { 10
0 , 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

1
E (𝑥 r )= 𝑇r,0 = (𝑥 r )( )dx
10

CONVERGENCIA DE SUCESION DE VARIABLES ALEATORIAS

Cuando tratamos sucesiones de variables aleatorias es imprescindible tener en cuenta su


comportamiento aleatorio por el cual lo mas que podemos decir es que tendremos una
probabilidad alta o baja de la que la convergencia tenga lugar.

La sucesión de variables aleatorias tiene propiedades asintóticas las cuales vienen ligadas a
conceptos como límite o convergencia

1.- Convergencia en Probabilidad o débil

Se dice que la sucesión de V.A.

{𝑥𝑛 }𝑛∞= 1 =Converge en probabilidad a X cuando 𝑛 →∞ y se escribe :

𝑥𝑛 𝑃 → 𝑋 ↔ lim 𝑃(|𝑥𝑛 − 𝑥 | > 𝜀) = 0 ∀𝜀 >0


𝑛→∞

Ejemplo
EE517-1453-INFERENCIA ESTADÍSTICA

Sea {𝑥𝑛 } una sucesion de V.A. tomando 𝑥𝑛 valores 0 y 𝑛2 con probabilidades respectivas
1 1 P
1- y demuestre que {𝑥𝑛 } → 0
𝑛 𝑛

Por definición:
P
𝑥𝑛 → 0 ↔ lim 𝑃(|𝑥𝑛 − 0| > 𝜀) = 0
𝑛→∞

i) 𝑃(|𝑥𝑛 − 0| > 𝜀) = 𝑃(𝑥𝑛 > 𝜀 ∨ 𝑥𝑛 < −𝜀)


= 𝑃(𝑥𝑛 > 𝜀) + P( 𝑥𝑛 < −𝜀)
= 𝑃(𝑥𝑛 > 𝜀) + 0

0 𝜀 𝑛2 𝜀 𝑥𝑛
1 1
1+ P (𝑥𝑛 )
𝑛 𝑛

1
Si 𝜀< 𝑛2 → 𝑃(𝑥𝑛 > 𝜀) = 𝑃(𝑥𝑛 = 𝑛2 ) =
𝑛

𝜀≥ 𝑛2 → 𝑃(𝑥𝑛 > 𝜀) =0

ii) Tomando Limite


1
lim 𝜀< 𝑛2
𝑛→∞ 𝑛

lim 0 𝜀≥ 𝑛2
𝑛→∞

lim 𝑃(|𝑥𝑛 − 0| > 𝜀) = 0


𝑛→∞

{𝑥𝑛 }𝑃 → 0

2.- Convergencia casi segura o fuerte

Se dice que la sucesión {𝑥𝑛 } converge en forma casi segura a X, cuando 𝑛 → ∞ y se simboliza:
𝑐. 𝑠
𝑥𝑛 → 𝑥 ↔P( lim 𝑥𝑛 = 𝑥 )= 1
𝑛→∞

3.- Convergencia en Distribución o Ley

Se dice que la sucesión {𝑥𝑛 } converge distribución a X, cuando 𝑛 → ∞ y se escribe


D
𝑥𝑛 → 𝑥 ↔ lim 𝐹𝑛 (𝑥) = F(X)
𝑛→∞

4.- Convergencia en Media Cuadrática

Se dice que la sucesión {𝑥𝑛 } converge en media cuadrática a X, cuando 𝑛 → ∞ y se denota


𝑚. 𝑐.
𝑥𝑛 → 𝑥 ↔ lim 𝐸(|𝑥𝑛 − 𝑥 |2 )= 0
𝑛→∞
EE517-1453-INFERENCIA ESTADÍSTICA

DESIGUALDAD DE CHEBYSHEV

Sea 𝑥̅ = 𝑥̅𝑛 , la media de una muestra aleatoria extraida de una población con densidad
𝑓(𝑥, 𝜇, 𝜎 2 ), 𝜇, 𝜎 2 finitos y 𝑔(𝑥̅ ), su correspondiente función de densidad.
Sabemos 𝐸 (𝑥̅ )= 𝜇
𝜎2
𝑉(𝑥̅ )= 𝜎 2 𝑥̅ = 𝑛

Supongamos que la gráfica de g (𝑥̅ ) es:


g (𝑥̅ )

k>0

𝜇 − 𝑘𝜎𝑥̅ 𝜇 𝜇 + 𝑘𝜎𝑥̅

Si 𝑥̅ cae en los extremos

𝑥̅ ≤ 𝜇 − 𝑘𝜎𝑥̅ → 𝑥̅ - 𝜇 ≤ −𝑘𝜎𝑥̅
𝑥̅ ≥ 𝜇 + 𝑘𝜎𝑥̅ → 𝑥̅ - 𝜇 ≥ 𝑘𝜎𝑥̅
𝑘𝜎
|𝑥̅ − 𝜇 | ≥ 𝑘𝜎𝑥̅ =
√𝑛

𝑘 2 𝜎2
|𝑥̅ − 𝜇 |2 ≥ (𝛼)
𝑛

Por otro lado


𝜎2
𝑉(𝑥̅ )= 𝜎 2 𝑥̅ = = (𝑥̅ − 𝜇)2 𝑔(𝑥̅ ). 𝑑 (𝑥̅ )= (𝑥̅ − 𝜇)2 𝑔(𝑥̅ ). 𝑑 (𝑥̅ ) +
𝑛

| (𝑥̅ − 𝜇)2 𝑔(𝑥̅ ). 𝑑 (𝑥̅ ) + (𝑥̅ − 𝜇)2 𝑔(𝑥̅ ). 𝑑 (𝑥̅ )

≥0

En donde K es un numero positivo arbitrariamente elegido. Se obtendrá una desigualdad


modificando el segundo miembro de la ecuación, es decir prescindiremos de la Segunda integral
𝑘 2 𝜎2
y como esta es positiva sustituiremos el factor (𝑥̅ − 𝜇)2 por
𝑛

𝜎2
≥ (𝑥̅ − 𝜇)2 𝑔(𝑥̅ ). 𝑑 (𝑥̅ ) + (𝑥̅ − 𝜇)2 𝑔(𝑥̅ ). 𝑑(𝑥̅ )
𝑛
EE517-1453-INFERENCIA ESTADÍSTICA

𝜎2 𝑘 2 𝜎2 𝑘 2 𝜎2
≥ 𝑔(𝑥̅ ). 𝑑 (𝑥̅ ) + 𝑔(𝑥̅ ). 𝑑 (𝑥̅ )
𝑛 𝑛 𝑛

𝜎2 𝑘 2 𝜎2
≥ [ 𝑔(𝑥̅ ). 𝑑 (𝑥̅ ) + 𝑔(𝑥̅ ). 𝑑(𝑥̅ ) ]
𝑛 𝑛

1
≥ 𝑔(𝑥̅ ). 𝑑(𝑥̅ ) + 𝑔(𝑥̅ ). 𝑑(𝑥̅ )
𝑘2

𝑘𝜎 1
P( |𝑥̅ − 𝜇 | ≥ ) ≤𝑘 2
√𝑛

LEY DEBIL DE LOS GRANDES NUMEROS


De la desigualdad de Chebyshev se tiene
𝑘𝜎 1
P( |𝑥̅ − 𝜇 | ≥ ) ≤𝑘 2
√𝑛

Sea:
𝑘𝜎 1 𝜎
𝜖= → =𝜖
√𝑛 𝑘 √𝑛

Entonces:
𝜎2
P( |𝑥̅ − 𝜇 | > 𝜖 ) ≤
𝜖2 𝑛

Tomando límite:
𝜎2
lim P( |𝑥̅ − 𝜇 | > 𝜖 ) ≤ lim =0
𝑛→∞ 𝑛→∞ 𝜖2 𝑛

{𝑥̅ } = {𝑥𝑛 }𝑃 → 𝜇

Observación

1) P( |𝑥𝑛 − 𝑥| > 𝜖) + P( |𝑥𝑛 − 𝑥| ≤ 𝜖) = 1

Entonces:

lim P( |𝑥𝑛 − 𝑥| ≤ 𝜖 ) = 1
𝑛→∞

𝜎2
2) Para 𝑛 suficientemente grande es muy pequeño luego existe 𝛿 >0 (tan
𝜖2 𝑛
pequeño como se quiere).
𝜎2 𝜎2
P( |𝑥̅𝑛 − 𝜇 | > 𝜖 ≤ 𝜖2 𝑛 < 𝛿 del cual se obtiene 𝑛 > 𝜖2 𝛿
EE517-1453-INFERENCIA ESTADÍSTICA

𝜎2
3) P( |𝑥̅𝑛 − 𝜇 | ≤ 𝜖) ≥ 1- >1- 𝛿
𝜖2 𝑛

TEORIA CENTRAL DEL LIMITE

Justifica la importancia de la distribución normal


Sea {𝑥𝑛 } una sucesión y sobre ella diferenciamos

𝑆1 = 𝑋1
𝑆2 = 𝑋1 + 𝑋2
𝑆3 = 𝑋1 + 𝑋2 + 𝑋3

𝑆𝑛 = 𝑋1 + 𝑋2 + 𝑋3 +………………..+𝑋𝑛
Lindeberg - Lévy demostraron que para 𝑛 →∞

𝑆𝑛 → N [𝐸(𝑆𝑛 ), 𝑉(𝑆𝑛 )]

También
𝑆𝑛 −𝐸(𝑆𝑛 )
Z= ~ N (0,1)
√𝑉(𝑆𝑛 )

Como 𝑆𝑛 = 𝑥𝑖

𝑆𝑛 𝐸(𝑆𝑛)
𝑛
− 𝑛 𝑥̅ − 𝜇
Z= = 𝜎 ~ N (0,1)
)
√𝑉(𝑆𝑛 √𝑛
𝑛

𝐸(𝑆𝑛 ) = 𝐸( 𝑥𝑖 ) = 𝑛𝐸(𝑥) = 𝑛 𝜇

𝑉(𝑆𝑛 ) = 𝑛𝜎2
EE517-1453-INFERENCIA ESTADÍSTICA

EJERCICIOS

1. El tiempo en horas que tarda una maquina en realizar un ciclo de trabajo tiene densidad:
𝑓(𝑥) = 2x 0<x<1
Calcule la probabilidad de que la maquina tarde más de 32 horas en realizar 45 ciclos

SOLUCION

X : Tiempo en horas de un ciclo

(𝑥1 , 𝑥2 , 𝑥3 , … … . . 𝑥45 , ) m.a.

W= 𝑥1 + 𝑥2 +𝑥3 +……...𝑥45

P(W>32)

W ~ N [𝐸(𝑤), 𝑉(𝑤)], por el T.C.L.


2
𝐸(𝑤) = 45 𝐸(𝑥) = 45 ( ) = 30
3
1
𝑉(𝑤) = 45 𝑉(𝑥) = 45 ( ) = 2.5
18

P(W>32) = 1 – P(W≤32)
32−30
= 1 – P (Z≤ )
√2.5

= 1 –P (Z≤ 1.26491)

= 1 – 0.89704 = 0.10296

2. Al lanzar un dado 500 veces ganamos 10.00 por punto si sale numero par y perdemos
10.00 por punto se sale número impar. Calcule la probabilidad de ganar menos de 2300.
SOLUCION

Sea X : Beneficio obtenido en un lanzamiento

(𝑥1 , 𝑥2 , 𝑥3 , … … . . 𝑥500 , ) m.a.

W= 𝑥1 + 𝑥2 +𝑥3 +……...𝑥500

P(W<2300)

W ~ N [𝐸(𝑤), 𝑉(𝑤)], por el T.C.L.

𝐸(𝑤) = 500 𝐸(𝑥)

𝑉(𝑤) = 500 𝑉(𝑥)

Dado x P(x)
1 -10 1⁄
6
2 20 1⁄
6
3 -30 1⁄
6
4 40 1⁄
6
5 -50 1⁄
6
6 60 1⁄
6
EE517-1453-INFERENCIA ESTADÍSTICA

3. En el curso de Inferencia Estadística la probabilidad de salir a la pizarra en cada clase es


del 10%, la asignatura tiene 100 clases. ¿Cuál es la probabilidad de tener que salir a la
pizarra más de 15 veces?

SOLUCION:

X: Número de veces que sale a la pizarra (en las 100 clases)

P(X>15)

1 𝑠𝑎𝑙𝑖𝑟 𝑝(1) = 0.1


𝑦1 {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
𝑦1 ~ B(1, 0.10)

X = 𝑦1 + 𝑦2 + 𝑦3 +…….𝑦100 T.C.L.

X~ b(100, 0.10) → N [𝐸(𝑥), 𝑉(𝑥)]

𝐸(𝑥)= 100 𝐸(𝑦1 ) = 100(0.10)

𝑉(𝑥)= 100 𝑉(𝑦1 ) = 100(0.10) (0.90)


EE517-1453-INFERENCIA ESTADÍSTICA

SEMANA 3
EE517-1453-INFERENCIA ESTADÍSTICA

DISTRIBUCIONES MUESTRALES

Se denomina distribución muestral de una estadística a la distribución de


probabilidad de esa variable aleatoria.
DISTRIBUCION DE MUESTREO
• Distribución de la media muestral o distribución muestral de la
media.
• Distribución de la varianza muestral o distribución muestral de la
varianza
DISTRIBUCION DE LA MEDIA MUESTRAL
Sea, 𝑥1 , 𝑥2 , 𝑥3 , … .., 𝑥𝑛 una muestra aleatoria de tamaño 𝑛 escogida de
una población 𝑓(𝑥) que tiene media 𝜇 y varianza 𝜎 2 .
𝑋̅ es una V.A. cuya distribución tiene las siguientes propiedades.

𝐸(𝑋̅)= 𝜇 Población infinita. - Muestreo con o sin reemplazo


𝜎 2
𝑉(𝑋̅)= Población finita. - con reposición
𝑛
2
𝜎 𝑁−𝑛
𝑉(𝑋̅)= 𝑛 .(𝑁−1 ) Población finita. - Muestreo sin remplazamiento
𝑁−𝑛
El coeficiente (𝑁−1 ) se denominas factor de corrección para población
finita
Cuando N tiende al infinito el factor de corrección tiende a 1
La desviación estándar de una estadística es conocida como error estándar.
Para 𝑛 suficientemente grande, la V.A.

𝑋̅ − 𝜇
Z= 𝜎 ~ N (0,1)
√𝑛
EE517-1453-INFERENCIA ESTADÍSTICA

Prueba
𝐸(𝑋̅)= 𝜇
1 1
𝐸( ) = 𝑛 𝐸( ) = 𝑛 𝐸( 𝑥1 + 𝑥2 + 𝑥3 + …𝑥𝑛 )
1
= 𝑛 [𝐸(𝑥1 ) + 𝐸(𝑥2 ) + 𝐸(𝑥3 )+. . +. 𝐸(𝑥𝑛 )]
1
= 𝑛 [𝜇 + 𝜇 + 𝜇 +. . +. 𝜇]

𝐸(𝑋̅)= 1𝑛 𝑛[𝜇] = 𝜇

1
𝑉(𝑋̅)= 𝑉( )= 𝑉( )
𝑛2
1
=𝑛2 𝑉[(𝑥1 ) + (𝑥2 ) + (𝑥3 )+. . +. (𝑥𝑛 )]
1
=𝑛2 [𝑉 (𝑥1 ) + 𝑉(𝑥2 ) + 𝑉(𝑥3 )+. . +. 𝑉(𝑥𝑛 )]
1
= (𝜎 2 + 𝜎 2 + 𝜎 2 + ⋯ … 𝜎 2 )
𝑛2

1 𝜎 2
𝑉(𝑋̅) =𝑛2 𝑛(𝜎 2 ) = 𝑛

Por el T.C.L. para 𝑛 → ∞


𝜎2
𝑥̅ ~ N (𝜇, )
𝑛
𝑥̅ − 𝜇
De donde Z= 𝜎 ~ N (0,1)
√𝑛

EJEMPLOS
1.- Sea ̅
𝒙𝟓𝟎 la media de una m.a. de tamaño 50 de la V.A. X cuya función
de densidad es:
2(1-x) 0<x<1
𝑓(𝑥) =
0 en otro caso
EE517-1453-INFERENCIA ESTADÍSTICA

13 7
Calcular P (40≤𝑥̅50 ≤20)

Solución
Por el T.C.L
1 1
̅𝟓𝟎 ~ N ( ,
𝒙 )
3 18(50)
1
𝐸(𝑋̅)= 𝜇 = 3
1
𝑉(𝑋̅)= 𝜎 2 = 18
13 1 7 1
13 7 − −
40 3 20 3
P (40≤𝑥̅50 ≤20) = P ( 1
≤𝑍≤ 1
)
√18(50) √18(50)

2. Siendo 𝑥 ~ N (𝜇, 1), determínese el tamaño muestral mínimo que debe


tomarse para garantizar con probabilidad no inferior a 0.95, que la media
muestral no difiera de la media poblacional en más de 0.5 unidades
Solución
P (|𝑥̅𝑛 − 𝜇|≤0.5) ≥0.95
P (|𝑥̅𝑛 − 𝜇|≤0.5) = P (𝜇 - 0.5≤𝑥̅𝑛 ≤𝑥̅𝑛 + 0.5)
𝜇−0.5−𝜇 𝜇+0.5−𝜇
=P( 1 ≤𝑥̅𝑛 ≤ 1 )
√𝑛 √𝑛

√𝑛 √𝑛
= P (- 2 ≤ 𝑍 ≤ )
2

√𝑛
= 2P (𝑍 ≤ ) -1
2

√𝑛
2P (𝑍 ≤ ) - 1 ≥0.95
2

√𝑛
P (𝑍 ≤ ) ≥0.975
2

entonces 𝑛≥
EE517-1453-INFERENCIA ESTADÍSTICA

3. Sea 1, 1, 1, 3, 4, 5, 6, 6, 6, 7 una población. Se extrae una muestra de


tamaño 36 con reemplazamiento de esta población.
Calcular
P (3.6 ≤𝑥̅ ≤ 4.4)
Solución
X 1 3 4 5 6 7
P(X=x) 0.3 0.1 0.1 0.1 0.3 0.1

𝜇 = 𝐸(𝑋)= 𝑥𝑖 𝑃(𝑥𝑖 )
𝜇=4
𝐸(𝑋 2 )= 𝑥𝑖 2 𝑃(𝑥𝑖 )=21
𝜎 2 = 𝐸(𝑋 2 )- ( 𝐸(𝑋))2 = 21 – 16 = 5
𝐸(𝑋̅)= 4
𝜎 2 5
𝑉(𝑋̅)= 𝜎𝑋̅ 2 = 𝑛𝑋̅ = 36
5
̅ ~ N (4, ), por el T.C.L.
𝒙 36
𝑋̅ − 4
P (3.6 ≤𝑥̅ ≤ 4.4) = P( 3.6−5 4 ≤ 4.4− 4
5
≤ 5
)
√ √ √
36 36 36

= P( −0.4 ≤ 𝑍 ≤ 0.4) = P( ≤ 𝑍 ≤ )

=P(𝑍 ≤ ) -P(𝑍 ≤ − )

=
Si la muestra es grande (𝑛 > 30) y la varianza poblacional desconocida
entonces la varianza poblacional se estima a partir de la varianza
muestral se usa la distribución normal.

𝑥̅ − 𝜇
Z= 𝑆 ~ N (0,1)
√𝑛
EE517-1453-INFERENCIA ESTADÍSTICA

DISTRIBUCION DE LA MEDIA MUESTRAL


Cuando la población es normal, muestra pequeña y varianza poblacional
desconocida.
Si 𝑥̅ es la media de una m.a. de tamaño 𝑛 con (𝑛 ≤ 30) extraída de una
población normal con media 𝜇 y varianza poblacional desconocida.

𝑥̅ − 𝜇
V.A. T = 𝑆 ~ 𝑇(𝑛−1) 𝑔𝑙
√𝑛

Tiene una distribución T-Student con (𝑛 − 1), grados de libertad donde:

(𝑋𝑖 − 𝑋̅)2
(𝑥𝑖−𝑥̅ )2
𝑆2 = Varianza de COCHRAN
𝑛−1

-𝑡𝑜 𝑡𝑜
Ejemplo
1. Un fabricante de alambres de acero afirma que la fuerza promedio
requerida para romper los alambres que fabrica es de 500kgs.,
para verificar esta afirmación se toma una m.a. de 25 trozos de
este alambre y se somete a prueba obteniéndose una media de
465Kgs. Y una desviación típica de 55kgs.
Suponiendo que las fuerzas de rompimiento pueden considerarse
como valores de una V.A. que se distribuye normalmente ¿Cuál es
la probabilidad de obtener un promedio de rompimiento entre
480 y 520kgs?

SOLUCION
𝜇=500 𝑥̅ =465
𝑛= 25 s=55
P (480<𝑥̅ <520) = P (𝑥̅ <520) - P (𝑥̅ <480)
EE517-1453-INFERENCIA ESTADÍSTICA

𝑥̅ − 𝜇
T= 𝑆 𝑇(24) 𝑔𝑙
√𝑛

520− 500 480− 500


P (𝑇 < 55 ) – P( 𝑇 < 55 )
5 5
20 −20
P (𝑇 < ) – P( 𝑇 < )
11 11
P (𝑇 <1.81818 ) – P( 𝑇 <−1.81818 ) = 2 P (𝑇 <1.81818 ) – 1
2. Al someter a prueba 5 pilas de calculadora se obtienen las siguientes duraciones en
horas 30, 20, 18, 15, 27. Se sabe que los tiempos de duración de las pilas se distribuye
normalmente cual es la probabilidad que nuestra estimación de la media poblacional a
partir de la media muestral se desvíe en más de 4 puntos
SOLUCION

P (|𝑥̅ − 𝜇 |>4) = 1 - P (|𝑥̅ − 𝜇 |≤4)


= 1 - P (-4≤𝑥̅ − 𝜇≤4)
−4 𝑋̅ − 𝜇 4
= 1 – P( 6.28 ≤ 6.28 ≤ 6.28 )
√5 √5 √5

= 1 – P (-1.42 ≤ 𝑇 ≤1.42)
= 1 – [P(𝑇 ≤ 1.42) – P (𝑇 ≤ −1.42)]
= 1 – 𝑃(𝑇 ≤1.42) + [1 − P(𝑇 ≤ 1.42)
= 1 – 𝑃(𝑇 ≤1.42) + 1 – 𝑃(𝑇 ≤1.42)
= 2 – 2𝑃(𝑇 ≤1.42425)
= 0.24
Previamente

=39.5

𝑆 = 6.28490
EJERCICIOS
1. Sea X una V.A. con función de probabilidad

X -1 0 1 2
p(x) 0.3 0.4 0.2 0.1

Del cual se toma una muestra aleatoria de tamaño 34.


Hallar:
EE517-1453-INFERENCIA ESTADÍSTICA

a) P (𝑋̅ < 0,34)


b) P (0.26≤ 𝑋̅ < 0.34)
2. Sea X una v.a. con función de densidad
𝑥3
𝑓(𝑥) = { ,0 < 𝑥 < 2
4
0 , 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Del cual se toma una m.a. de tamaño 32

a) P (𝑋̅ < 1,8)


b) P (1,5 < 𝑋̅ < 1,9)
c) P (1,5 < 𝑋̅ < 1,6/ 𝑋̅ < 1,6)
3. Sea 𝑥̅36 la media de un m.a. de tamaño 36 de la v.a. cuya función de densidad es:

3
𝑥 2 , −1 < 𝑥 < 1
𝑓(𝑥) = {2
0 , 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

Calcular P (0.03≤ 𝑥̅36 ≤ 0.15)

4. Se tiene

X 0 1 2
P(x) 0.5 0.4 0.1

Calcular µ(𝑋) , 𝜎𝑥 2 , µ(𝑥̅ ) , 𝜎𝑥̅ 2

5. Una variable aleatoria se distribuye normalmente

Si: 𝐸(𝑥 2 ) = 68 P(x<10) = 0.8413


Determinar µ y 𝜎 2
Además, si n=8 Hallar P (|𝑥̅ |>2)

6. Suponga que X es una v.a. normal z y que 𝑥1 , 𝑥2 , 𝑥3 , 𝑥4 es una m.a. de X se define


∑ 𝑥𝑖 1
𝑥̅ = calcular P (|𝑥̅ |> )
4 2

7. Calcular 𝐸(𝑥) y 𝑉(𝑥) Sabiendo que:


a) X se distribuye normalmente
b) P (𝑥̅ <6) = 0.0228
c) P (𝑥̅ > 8) = 0.843
d) 𝑥̅ corresponde a una muestra de tamaño 4.

8. Se toma una muestra aleatoria de 100 libros de una población de 500 libros cuya
desviación estándar es 𝛔 = 145 ¿Cuál es la probabilidad de que la media muestral
difiera de la media poblacional en más de 26?
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA

SEMANA 4
EE517-1453-INFERENCIA ESTADÍSTICA

APROXIMACIONES A LA DISTRIBUCION NORMAL

Como consecuencia al T.C.L. estudiaremos la aproximación de varias


distribuciones de probabilidad discreta que se aproximan a la normal.
Siempre que se utiliza una aproximación de las distribuciones discretas a
una distribución continua se emplea un ajuste llamado corrección por
continuidad.
APROXIMACION BINOMIAL A LA NORMAL
Sea {𝑋𝑛 }, una sucesión de variables aleatorias de Bernoulli independientes
y.
X= 𝑥𝑖

Entonces X ~ b (𝑛, π)
Con E(x) = 𝑛π
V(x) = 𝑛π (1- π)
Para 𝑛 → ∞ por el T.C.L.
X ~ N (𝑛π, 𝑛π (1- π))
De donde
𝑥−𝑛π
Z= ~ N (0,1)
√𝑛π−(1− π)

Con la corrección por continuidad:


𝑥±0.5 −𝑛π
Z=
√𝑛π−(1− π)

También:
𝑥
−π
𝑛
Z=
π(1− π)

𝑛

Con la corrección por continuidad


𝑥 1
± −π
𝑛 2𝑛
Z=
π(1− π)

𝑛
EE517-1453-INFERENCIA ESTADÍSTICA

En general la experiencia indica que la aproximación es buena cuando:


1 1
𝑛𝜋 > 5 para 𝜋 ≤ 2 v 𝑛(1 − π)>5 para 𝜋 < 2
Algunos casos del uso de la corrección pro continuidad

P (a ≤ X ≤ b) ≅ P (a- 0.5 ≤ X ≤ b + 0.5)

P (a < X ≤ b) ≅ P (a+ 0.5 < X ≤ b + 0.5)

P (a ≤ X < b) ≅ P (a- 0.5 ≤ X < b - 0.5)

APROXIMACION DE LA DISTRIBUCION DE POISSON A LA NORMAL

Sea {𝑋𝑛 }, una sucesión de V.A. de Poisson independientes con


parámetros λ
X= 𝑥𝑖
Entonces X ~ P (𝑛, λ)
Con E(x) = 𝑛 λ
V(x) = 𝑛 λ
Para 𝑛 → ∞ por el T.C.L.
Consideramos
X ~ N (𝑛 λ, 𝑛 λ)
Construyendo la V.A.Z. considerando la corrección por continuidad
𝑥±0.5 −𝑛λ
Z=
√𝑛 λ

En la práctica se considera una buena aproximación cuando 𝑛 λ>5.

APROXIMACION DE LA DISTRIBUCION HIPERGEOMÉTRICA A LA NORMAL


Sea {𝑋𝑛 }, una sucesión de V.A. de una distribución Hipergeométrica de
parámetros N, 𝑛, 𝑀
M
E(x) = 𝑛 𝑁
M 𝑀 N−n
V(x) = 𝑛 𝑁 (1- 𝑁 )( 𝑁−1)
EE517-1453-INFERENCIA ESTADÍSTICA

Para 𝑛 → ∞ por el T.C.L.


𝑀 𝑀 𝑀 𝑁−𝑛
X ~ N [𝑛 ( 𝑁 ) , 𝑛 ( 𝑁 ) (1 − )( 𝑁−1 )]
𝑁

De donde
M
𝑥±0.5 −𝑛 𝑁
Z= ~N (0,1)
M 𝑀 N−n
√𝑛 (1− )( )
𝑁 𝑁 𝑁−1

EJEMPLOS
2
1. Sea 𝑥1 , 𝑥2 , 𝑥3 , … .. 𝑥32 , V.A. de Poisson distribuidos cada uno con λ=3
32

Calcular: P (15< 𝑥1 <22)

SOLUCIÓN
32

P (15< 𝑥1 <22)

32
2 64
𝑥𝑖 ~ P (64/3) 𝑛 λ = 32( 3) = 3

Como 𝑛 es grande se cumple el T.C.L.


32 32

P (15< 𝑥1 <22) = P (15 + 0.5 < 𝑥1 <22 - 0.5)


64 64
15.5− 21.5−
3 3
=P( 64
< 𝑍< 64
)
√3 √3

2. Se supone que la probabilidad de que un pasajero opte por una compañía aérea dada
para hacer un viaje es 0.5. Tomando un grupo de 400 pasajeros potenciales. Esta
compañía vende billetes a cualquiera que se lo indica, pero la capacidad de un avión es
de 230 pasajeros se pide:

a) La probabilidad de que la compañía tenga un overbooking es decir que un pasajero


no tenga asiento

b) Si existen 10 compañías aéreas que realizan el mismo viaje y cuyas condiciones son
similares a la anterior.
¿Cuál es la probabilidad de que al menos dos de ellos tengan un overbooking?
EE517-1453-INFERENCIA ESTADÍSTICA

SOLUCION

a) P (X > 230)

X: Numero de pasajeros

X ~ b (400,0.5)

P (X > 230) ≅ P (X > 230+0.5)


230.5−200
= P(Z>
10
)
= P(Z> 3.05)
=1 - P (Z ≤ 3.05)

=1–
= 0.00114
b) 𝑦 : Numero de compañías que tienen un overbooking
𝑦 ~ b (10,0.00114)

P(𝑦 ≥ 2) = 1 - P(𝑦 < 2)

= 1 - [P(y = 0) + P(y = 1)]

= 1 - [(10
0
)(0.00114)0 (1 − 0.00114)10 + (10
1
)(0.00114)1 (1 − 0.00114)9 ]

DISTRIBUCION MUESTRAL DE LA DIFERENCIA O SUMA DE MEDIAS


CON VARIANZA POBLACIONAL CONOCIDA

Sea 𝑥̅1 , y 𝑥̅2 las medias de 2 muestras aleatorias Independientes de tamaño 𝑛1 y 𝑛2


seleccionadas respectivamente de las poblaciones 1 y 2 y que tienen medias 𝜇1 y 𝜇2 y
varianzas supuestas conocidas 𝜎1 2 y 𝜎2 2 entonces definimos las variables aleatorias
𝑥̅1 ±𝑥̅2 que tiene las siguientes propiedades.
a) E (𝑥̅1 + 𝑥̅2 ) = E (𝑥̅1 ) ± E (𝑥̅2 ) = 𝜇1 ±𝜇2

b) 𝜎𝑥̅21 +𝑥̅2 = V (𝑥̅1 ± 𝑥̅2 ) = V (𝑥̅1 ) + V (𝑥̅2 )

𝜎1 2 𝜎2 2
= +
𝑛1 𝑛2

c) Para 𝑛1 y 𝑛2 suficientemente grande la distribución de la V.A.


EE517-1453-INFERENCIA ESTADÍSTICA

̅ 1 ±𝑥̅ 2 −(𝜇1± 𝜇2 )
𝑥
Z= ~N (0,1)
𝜎1 2 𝜎 2
√ + 2
𝑛1 𝑛2

Pero si las dos poblaciones son normales entonces:


𝜎 2 𝜎 2
𝑥̅1 ~N (𝜇1 , 𝑛1 ) 𝑥̅2 ~N (𝜇2 , 𝑛2 )
1 2

Para 𝑛1 , 𝑛2 ≥ 2

La distribución de la V.A. 𝑥̅1 ± 𝑥̅2 es normal con media 𝜇1± 𝜇2 y varianza


𝜎1 2 𝜎2 2
+
𝑛1 𝑛2

̅ 1 ±𝑥̅2 −(𝜇1± 𝜇2 )
𝑥
Z= ~N (0,1) 𝑛1 ≥ 2 , 𝑛2 ≥ 2
𝜎1 2 𝜎 2
√ + 2
𝑛1 𝑛2

Si las poblaciones fuesen finitas de tamaño 𝑁1 y 𝑁2


̅1 ±𝑥̅2 −(𝜇1± 𝜇2 )
𝑥
Z=
𝜎1 2 𝑁1 −𝑛1 𝜎 2 𝑁 −𝑛
√ ( 𝑁 −1 ) + 𝑛2 ( 𝑁2 −12 )
𝑛1 1 2 2

OBSERVACION
1) Si las poblaciones no son normales, pero 𝑛1 𝑦 𝑛2 →∞ por el T.C.L. el
resultado es válido.

2) El resultado es válido si se realiza un muestreo con reemplazamiento


de una población finita o si la población es infinita.

3) Si el muestreo es sin reemplazamiento de una población finita

𝜎1 2 𝑁1 −𝑛1 𝜎2 2 𝑁2 −𝑛2
𝑥̅1 − 𝑥̅2 ~N [𝜇1 − 𝜇2 , ( )+ ( )]
𝑛1 𝑁1 −1 𝑛2 𝑁2 −1

̅1 −𝑥̅2 −(𝜇1 − 𝜇2 )
𝑥
Z= 2
~N (0,1)
𝜎 𝑁 −𝑛 𝜎 2 𝑁 −𝑛
√ 1 ( 1 1) + 2 ( 2 2)
𝑛1 𝑁1 −1 𝑛2 𝑁2 −1
EE517-1453-INFERENCIA ESTADÍSTICA

EJERCICIOS

1) Dada la información acerca de las vidas útiles de 2 marcas de pilas

MARCA A MARCA B
𝜇1 51 𝜇2 50
𝜎1 8 𝜎2 6
Si se selecciona una muestra aleatoria de 100 pilas de cada marca. ¿Cuál es la
probabilidad de que la vida útil media de la marca B sea:

a) Superior a la de la marca A en 0.6 horas o más.


b) Inferior a la de la marca A en 0.6 horas o más.

SOLUCION

Población 1 Población 2

𝜇1 =51 𝜇1 =50
𝜎1 =8 𝜎2 =6
𝑛1 =100 𝑛2 =100
a) P ( 𝑥̅𝐵 − 𝑥̅𝐴 ≥ 0.6)
P (−(𝑥̅𝐴 − 𝑥̅𝐵 ≥ 0.6)
𝑥̅ 𝐴 −𝑥̅ 𝐵 −(51− 50) −0.6 −1
P( 𝑥̅𝐴 − 𝑥̅𝐵 < −0.6) = P ( < )
√ 64 + 36 √ 64 + 36
100 100 100 100

= P (Z <-1.6)

=
−0.6 −1
b) P (𝑥̅𝐵 − 𝑥̅𝐴 ≥ 0.6) = P (𝑧 ≥ )
1
= P (𝑧 ≥ −0,4 ) = 1 - P (𝑧 < −0,4 )

= 1 – 0.34458

= 0.65542

2) Si 𝑥̅1 , y 𝑥̅2 las medias de los pesos de las muestras.


Donde

𝜇1 =𝜇2 =120 𝜎1 2 = 𝜎2 2 =18 𝑛1 =𝑛2

Se sabe que 𝑥̅1 - 𝑥̅2 ~N


a) Hallar el valor del tamaño de la muestra si: P ( |𝑥̅1 − 𝑥̅2 | < 2) =0.95
Solución:
36
𝑥̅1 - 𝑥̅2 ~N (0, )
𝑛
P ( |𝑥̅1 − 𝑥̅2 | < 2) =0.95
EE517-1453-INFERENCIA ESTADÍSTICA

P (−2 < 𝑥̅1 − 𝑥̅2 < 2) =0.95

Hallando la V.A.Z.
−2 𝑥̅ 1 −𝑥̅ 2 2
P( 6 < 𝜎 < 6 ) =0.95
√𝑛 √𝑛 √𝑛

√𝑛 √𝑛
P (− <𝑧< ) = 0.95
3 3

√𝑛 √𝑛
P (𝑧 < ) - P (𝑧 < − ) = 0.95
3 3

√𝑛 √𝑛
P (𝑧 < ) - [1 − P (𝑧 < )]= 0.95
3 3

√𝑛
2 P (𝑧 < ) = 1.95
3

√𝑛
P (𝑧 < ) = 0.975
3

√𝑛
= 1.96
3

√𝑛 = 1.96(3)

√𝑛 = 5.88
𝑛 =34.57 = 35

3) La duración media de las bombillas tipo A es de 2500 horas con desviación típica
600 horas y la duración media de las bombillas tipo B es de 2300 horas con
desviación típica de 800 horas
Se toma 300 bombillas del tipo A y 200 del tipo B.
a) Calcular la probabilidad de que la duración media de las bombillas tipo A no
supere en mas de 100 horas la duración media de la del tipo B.
b) Determine un intervalo simétrico a la media en el que puede esperarse con
probabilidad 0.95 que se encuentre la diferencia de medias muestrales.
SOLUCION
𝑋𝐴 : Duración de una bombilla de tipo A
𝑋𝐴 ~ 𝑓( x, 2500, 6002) 𝑛𝐴 = 300
𝑋𝐵 : Duración de una bombilla tipo B
𝑋𝐵 ~ 𝑓( x, 2300, 8002) 𝑛𝐵 = 200
a) P (𝑥̅𝐴 − 𝑥̅𝐵 ≤ 100)
6002 8002
𝑥̅𝐴 − 𝑥̅𝐵 ~ 𝑁 (200, , )
300 200
EE517-1453-INFERENCIA ESTADÍSTICA

𝑥̅ 𝐴 −𝑥̅ 𝐵 −200 100−200


P (𝑥̅𝐴 − 𝑥̅𝐵 ≤ 100) = P ( ≤ )
√1200+ 3200 √1200+ 3200
−100
= P (𝑍 ≤ ) = P (𝑍≤ −1.50756)
√4400

B) P (|𝑥̅𝐴 − 𝑥̅𝐵 − 200|≤ m) = 0.95


P (-m<𝑥̅𝐴 − 𝑥̅𝐵 − 200<m)= 0.95
P (-m+200<𝑥̅𝐴 − 𝑥̅𝐵 <m+200) = 0.95

P( 200−𝑚−200
√4400
𝑥̅ −𝑥̅ 𝐵−200 𝑚+200−200
< 𝐴 4400

< √4400 ) =0.95
𝑚 𝑚
P (- 66.33249<𝑧<66.33249 ) =0.95

𝑚
2 P (𝑧<66.33249) -1 = 0.95

𝑚
2P ( 𝑧 < )= 1.95
66.33249

𝑚
P (𝑧<66.33249)= 0.975
𝑚
=1.96
66.33249

𝑚 = (1.96) ( 66.33249)

𝑚 = 130 .01168

𝑚 ≅ 130

Para muestras pequeñas 𝑛1 +𝑛2 ≤ 30 y varianzas poblacionales desconocidas pero distintas


(𝜎1 2 ≠𝜎2 2 )

𝑥̅ 1 −𝑥̅ 2 − (𝜇1 −𝜇2 )


T=
𝑆1 2 𝑆2 2
~ 𝑇𝑔𝑙
√ +
𝑛1 𝑛2

Donde

2 2 2
𝑆 𝑆2
[1 + ]
𝑛1 𝑛2
𝑔= 2 2 –2
𝑆 2 𝑆 2
[ 𝑛1 ] [ 𝑛2 ]
1 2
+
𝑛1 +1 𝑛2 +1

Expresado mediante un numero entero


EE517-1453-INFERENCIA ESTADÍSTICA

2
• Con varianzas poblacionales desconocidas pero iguales (𝜎1 =𝜎2 2 )
Entonces la V.A.

𝑥̅ 1 −𝑥̅ 2 − (𝜇1 −𝜇2 )


T=
(𝑛1 −1)𝑆1 2 +(𝑛2 −1)𝑆2 2 1 1
~ 𝑇(𝑛 +𝑛 −2)𝑔𝑙
1 2
√ ( + )
𝑛1 +𝑛2 −2 𝑛1 𝑛2

𝑥̅ 1 −𝑥̅ 2 − (𝜇1 −𝜇2 )


T= 1 1
~ 𝑇(𝑛 +𝑛 −2)1 2
√𝑆𝑃 (𝑛 +𝑛 )
2
1 2

En un examen de estadística y cálculo de probabilidades de 12 estudiantes de la escuela de


matemáticas con promedio de 16 y 𝜎 = 1.2 mientras que en la escuela de Física se tiene 15
estudiantes con promedio de 15 y 𝜎 = 1.6.

Determinar la probabilidad de observar una diferencia entre medias muestrales de 0.8 o menos
si se supone que las varianzas poblacionales son desconocidas pero distintas y no hay ninguna
diferencia en el promedio verdadero en las 2 secciones

Se supone que la distribución de las calificaciones es aproximadamente normal.

SOLUCION

𝑥̅1 = 16 𝑆1 = 1.2 𝑛1 = 12 𝜇1 = 𝜇2
𝑥̅2 = 15 𝑆2 = 1.6 𝑛2 = 15 𝑛1 + 𝑛2 ≤ 30
Con 𝜎1 2 ≠𝜎2 2 → P( |𝑥
̅1 − 𝑥
̅ 2 |≤ 0.8)

𝑥̅ 1 −𝑥̅ 2 − (𝜇1 −𝜇2 ) 𝑥̅ 1 −𝑥̅ 2


T=
𝑆1 2 𝑆2 2
= 𝑆1 2 𝑆2 2
~ 𝑇𝑔
√ + √ +
𝑛1 𝑛2 𝑛1 𝑛2

2
1.44 2.56
[ + ]
12 15
𝑔= 1.44 2 2.56 2 – 2 = 27
[ ] [ ]
12 15
+
13 16

P( |𝑥
̅1 − 𝑥
̅ 2 |≤ 0.8) = P (-0.8≤𝑥̅𝐴 − 𝑥̅𝐵 ≤0.8)

0.8 𝑥̅ 1 −𝑥̅ 2 0.8


= P (- ≤ ≤ )
0.53914 𝑆1 2 𝑆2 2 0.53914
√ +
𝑛1 𝑛2

= P (- 1.48384 ≤𝑇 ≤ 1.48384) = 2 P (𝑇 ≤ 1.48384) - 1


EE517-1453-INFERENCIA ESTADÍSTICA

2 tecnicas de ventas 1y2

𝑇1 𝑇2

𝑋̅1=68 𝑋̅2=72

𝑆 2 =50 𝑆 2 =75

𝑛1 =12 𝑛2 =15

¿Si se supone que la variabilidad de ventas por ambas tecnicas es desconocida pero iguales,
presentan estos datos suficientes evidencias para indicar que la técnica 2 produce mejores
resultados que la técnica 1?

Se supone que la distribución de ambas técnicas de ventas son aproximadamente normal

SOLUCIÓN

Como 𝜎1 2 =𝜎2 2 pero desconocidos

𝑛1 + 𝑛2 =27 ≤30 P (𝜇2 > 𝜇1 ) =?

𝑥̅ 2 −𝑥̅ 1 − (𝜇2 −𝜇1 )


T=
(𝑛1 −1)𝑆1 2 +(𝑛2 −1)𝑆2 2 1 1
~ 𝑇27−2=25
√ ( + )
𝑛1 +𝑛2 −2 𝑛1 𝑛2

P (𝜇2 > 𝜇1 ) = P (𝜇1 − 𝜇2 < 0)

=P (−(𝜇2 − 𝜇1 ) < 0)

𝑥̅ 2 −𝑥̅ 1 − (𝜇2 −𝜇1 ) (𝑥̅ 2 −𝑥̅ 1 )


=P( < )
(11)(50) +(14)75 1 1 (11)(50) +(14)75 1 1
√ ( + ) √ ( + )
25 12 15 25 12 15
4
= P (T< ) = P (T< 1.29101)
3.09835

T P

1.058 0.85

1.29101 X Interpolando

1.316 0.90
EE517-1453-INFERENCIA ESTADÍSTICA

EJERCICIOS

1. En un estudio para comparar los pesos promedios de niños y niñas de 6to grado en una escuela
primaria se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para
niños como para niñas los pesos siguen una distribución normal. El promedio de los pesos de
todos los niños de sexto grado de esa escuela es de 100 libras y su desviación estándar es de
14.142, mientras que el promedio de los pesos de todas las niñas del sexto grado de esa escuela
es de 85 libras y su desviación estándar es de 12.247 libras. Si 𝑥̅1 ,representa el promedio de
los pesos de 20 niños y 𝑥̅2 es el promedio de los pesos de una muestra de 25 niñas, encuentre
la probabilidad de que el promedio de los pesos de los 20 niños sea al menos 20 libras mas
grande que el de las 25 niñas.

2. Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a 2
compañías, los tubos de la compañía A tienen una vida media de 7.2 años con una desviación
estándar de 0.8 años mientras que las de la B tienen una vida media de 6.7 años con una
desviación estándar de 0.7

a) Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compañía A


tenga una vida promedio de al menos un año más que la de una muestra aleatoria de 40
tubos de la compañía B.

b) ¿Cuál es la probabilidad de que la diferencia en vidas promedio se encuentra entre 0.65


y 0.83 km/s a favor de los tubos de la compañía?
EE517-1453-INFERENCIA ESTADÍSTICA

SEMANA 4
EE517-1453-INFERENCIA ESTADÍSTICA

DISTRIBUCION MUESTRAL DE LA PROPORCION


Sea 𝑥1 , 𝑥2 , 𝑥3 ,………… 𝑥𝑛 , una m.a. de tamaño 𝑛 escogida de la población de Bernoulli B
(1,𝜋), donde 𝜋 es el porcentaje de éxitos en la población:

𝑥 + 𝑥 + 𝑥 ….+𝑥𝑛 𝑥 # 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑐𝑜𝑛 𝑙𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟𝑖𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑒𝑠


𝑃̅ = 1 2 3 = =
𝑛 𝑛 𝑛

La proporción de éxitos en la muestra.


Siendo X=𝑥1 + 𝑥2 + 𝑥3 … . +𝑥𝑛 una variable Binomial
𝑥 1 1
̅)=𝐸( )= 𝐸(𝑋) = 𝑛𝜋 = 𝜋
b(𝑛, 𝜋) entonces 𝜇𝑃̅ = 𝐸(𝑃 𝑛 𝑛 𝑛

𝑥 1 1
𝜎 2 𝑃̅ = V(𝑃̅) = 𝑉(𝑛) =𝑛2 𝑉(𝑋) = 𝑛2 𝑛𝜋(1 − 𝜋)
𝜋(1−𝜋)
𝜎 2 𝑃̅ = 𝑛

Si 𝑛 es suficientemente grande entonces la V.A.


𝜋(1−𝜋)
𝑃̅ ~ N (𝜋, )
𝑛
̅
𝑃 −𝜋
Z= ~ N (0,1)
𝜋(1−𝜋)

𝑛

𝜋(1−𝜋)
Donde 𝜎𝑃̅ = √
𝑛

Si la población es finita y el muestreo sin reposición entonces:


𝜋(1−𝜋) 𝑁−𝑛)
𝜎 2 𝑃̅ = ( )
𝑛 𝑁−1

𝜋(1 − 𝜋) 𝑁 − 𝑛)
𝜎𝑃̅ = √ ( )
𝑛 𝑁−1
EE517-1453-INFERENCIA ESTADÍSTICA

DISTRIBUCION MUESTRAL DE LA DIFERENCIA DE PROPORCIONES


Sea 𝑥1 , 𝑥2 , 𝑥3 ,………… 𝑥𝑛1 , una m.a. extraída de la población X; 𝑦1, 𝑦2 , 𝑦3 ,………… 𝑦𝑛2 , una
m.a. extraída de la población Y, ambas poblaciones independientes de modo que:
𝑥1 + 𝑥2 + 𝑥3 ….+𝑥𝑛 𝑋
̅1 =
𝑃 =
𝑛1 𝑛1

𝑦1 + 𝑦2 + 𝑦3 ….+𝑦𝑛 𝑌
̅2 =
𝑃 =
𝑛2 𝑛2

Donde la V.A. X~b (𝑛1 , 𝜋1 )

Y~b (𝑛2 , 𝜋2 )
̅ 1 − 𝑃̅ 2 tiene una distribución de
Entonces la V.A. diferencia de proporciones 𝑃
probabilidad cuyas propiedades son:
E (𝑃̅ 1 − 𝑃̅ 2 ) = 𝜇𝑃̅ 1 −𝑃̅ 2 = E (𝑃̅ 1) – E (𝑃̅ 2 )

= 𝜋1 - 𝜋2

V (𝑃̅ 1 − 𝑃̅ 2 ) = 𝜎 2 𝑃̅1−𝑃̅2) = V (𝑃̅ 1 ) + V (𝑃̅ 2 )


𝑋 𝑌
=V( )+V( )
𝑛1 𝑛2

1 1
= V (𝑥) + V (𝑦)
𝑛1 2 𝑛2 2

1 1
= 𝑛1 𝜋1 (1 − 𝜋1 ) + 𝑛2 𝜋2 (1 − 𝜋2 )
𝑛1 2 𝑛2 2

𝜋1 (1−𝜋1 ) 𝜋2 (1−𝜋2 )
V (𝑃̅ 1 − 𝑃̅ 2 ) = +
𝑛1 𝑛2

Para 𝑛1 , 𝑛2 →∞
𝜋1 (1−𝜋1 ) 𝜋2 (1−𝜋2 )
̅ 1~N( 𝜋1 ,
𝑃 ) ̅ 2 ~N( 𝜋2 ,
𝑃 )
𝑛1 𝑛2

Entonces
𝜋1 (1−𝜋1 ) 𝜋2 (1−𝜋2 )
̅ 1 − 𝑃̅ 2 ~N( 𝜋1 − 𝜋2 ,
𝑃 + )
𝑛1 𝑛2

̅ 1 −𝑃
𝑃 ̅2 −(𝜋1 −𝜋2 )
Z= ~ N (0,1)
𝜋 (1−𝜋1) 𝜋2(1−𝜋2)
√ 1 +
𝑛1 𝑛2

En poblaciones finitas muestreo sin reposición


̅ 1 −𝑃
𝑃 ̅2−(𝜋1−𝜋2)
Z= ~ N (0,1)
𝜋 (1−𝜋1) 𝑁1 −𝑛1 ) 𝜋2(1−𝜋2 ) 𝑁2 −𝑛2 )
√ 1 ( )+ ( )
𝑛1 𝑁1 −1 𝑛2 𝑁2 −1
EE517-1453-INFERENCIA ESTADÍSTICA

EJEMPLOS

1) Si el 70% de los estudiantes llegan tarde y seleccionamos 100 estudiantes al azar,


determine la probabilidad de que la proporción de estudiantes que lleguen tarde
este entre
P (0,65<𝑃̅ <0.80)

0.7(0.8)
𝑃̅ ~N( 0.7, )
100

0.65−0.70 0.80−0.70
P( <𝑍< )
0.7(0.30) 0.7(0.30)
√ √
100 100

P (Z< 2.18218) – P (Z< - 1.09109)

2) El Gerente de venta de TV cable estima en 20% las conexiones domiciliarias


clandestinas. ¿Cuál es la probabilidad de que una muestra de 100 conexiones,
domiciliarias seleccionadas de una población de 1000 domicilios que tiene TV cable
más del 30% resulten clandestino.

3) Una empresa de estudios de mercado quiere conocer las proporciones de varones


y mujeres que conocen un producto promocional a escala nacional.

Supongamos que el 25% de varones y 30% de mujeres están familiarizados con dicho
artículo a escala nacional. Se hace una encuesta a nivel nacional sobre una muestra
aleatoria de 200 varones y 200 mujeres.

¿Cuál es la probabilidad de que los resultados muestrales muestran de que las


mujeres están más familiarizadas que los varones?

Sea X: # Mujeres que están familiarizado con dicho artículo.

Y: # Varones

𝜋1 =0,3 𝑛1 =200 E (𝑃̅ 1 − 𝑃̅ 2 ) = 𝜋1 − 𝜋2


𝜋2 =0.25 𝑛2 =200 = 0,3 – 0.25 =0.05
(0,3)(0,7) (0,25)(0,75)
V (𝑃̅ 1 − 𝑃̅ 2 )= +
200 200

̅ 1 > 𝑃̅ 2 ) =P(𝑃̅ 1 − 𝑃̅ 2 > 0)


P(𝑃 = 0.0019875
̅ 1 −𝑃
𝑃 ̅ 2 −0,05) 0−0,05)
=P ( > ) 𝜎𝑃̅ 1 −𝑃̅ 2 =0.04458
0.04458 0.04458

= P(Z>-1.12158) = 1 -P(Z≤-1.12158)
EE517-1453-INFERENCIA ESTADÍSTICA

SEMANA 4
EE517-1453-INFERENCIA ESTADÍSTICA

EJERCICIOS
1) Cuantas muestras aleatorias simples de tamaño 3 sin reemplazo se pueden
obtener de las siguientes poblaciones:

a) Una población de 6 datos


b) Una población de 10 cuentas por pagar
c) Una N=20 Trabajadores de departamento de planeación.

2) Se tiene una población de 5 obreros calificados, los cuales tienen los siguientes
ingresos por laborar horas extras a la semana 758, 618, 550, 589, 720 nuevos
soles.
a) Determine el número de muestras posibles de tamaño 3 y 4 sin reemplazo.
b) Elaborar las 2 distribuciones muestrales para cada tamaño de muestra.
c) Calcular el error estándar de las dos distribuciones.
d) Redacte sus conclusiones
3) Se sacan varias muestras de poblaciones normalmente distribuidas con medias
y varianzas como se muestra a continuación:
a. n=10 μ=30 𝜎 2 =9
b. n=15 μ=50 𝜎 2 =4
c. n=30 μ=100 𝜎 2 =100
d. n=100 μ=400 𝜎 2 =64
En cada caso determine la media y la desviación estándar de la distribución
muestral de 𝑥̅ .
4) Se define la V.A.X. como estatura de los estudiantes de matemática donde
μ=1.66m, 𝜎= 0.07m. Si se toma una m.a. de tamaño 40. Determine la
probabilidad de que la media muestral:

a) Exceda de 1.65m
b) Este entre 1.63m y 1.68m
c) Sea inferior a 1.64m
d) Sea inferior a 1.63 o superior a 1.69m
e) Cuál sería la altura mínima del 10% de los estudiantes mas altos
EE517-1453-INFERENCIA ESTADÍSTICA

EJERCICIOS
DISTRIBUCIONES MUESTRALES PARA MUESTRAS PEQUEÑAS. VARIANZA
MUESTRAL, DIFERENCIA DE MEDIAS CON VARIANZA DESCONOCIDA Y
RAZON DE DOS VARIANZAS MUESTRALES

1. Suponga que 𝑋1 , 𝑋2 ,… 𝑋8 es una m.a. de una variable aleatoria normal estándar.


Calcular:
P[3.49 < ∑8𝑖=1 𝑥𝑖2 < 17.5]

𝑠2
2. En el problema anterior calcular P[𝜎2 < 1.4], donde S2 es la varianza de la
muestra.

3. Si 𝑋1 tiene una distribución chi-cuadrado con 7 grados de libertad y 𝑋2 tiene una


distribución chi-cuadrado con 3 grados de libertad, independiente de 𝑋1 , calcular
la probabilidad que 𝑋1 + 𝑋2 exceda a 12.

4. Sean 𝑦1 y 𝑦2 , una muestra aleatoria de n =2 observaciones de una distribución


normal con media μ y varianza σ2

𝑦1 −𝑦2
a) Demuestre que z = tiene una distribución normal estándar
√2𝜎
b) Dado el resultado del inciso a, demuestre que z 2 tiene una distribución
X2 con un grado de libertad.

5. Supongamos que un punto (X, Y), es elegido al azar de un plano XY, donde X e Y
son variables aleatorias independientes y cada una tiene una distribución normal
estándar. Si un círculo es seleccionado en el plano XY con centro en el origen.
¿Cuál es el menor radio del circulo que puede ser elegido de modo que el punto
X, Y) esté en el interior del circulo con probabilidad de 0.99?

6.

a). Sea 𝑋1 , 𝑋2 ,… 𝑋𝑛 , una muestra aleatoria simple extraída de una población con
media μ y varianza σ2
𝜎
Demostrar que: E(𝑋̅)=μ y 𝜎𝑋̅ =
√𝑛
b). Examinados los incrementos salariales de los altos ejecutivos de un amplio
grupo de empresas se observa que tiene una distribución normal de media 12.1%
y desviación típica 3.5%. Se toma una muestra aleatoria de 16 observaciones de
la población de incrementos salariales
EE517-1453-INFERENCIA ESTADÍSTICA

b.1) ¿Cuál es el error estándar (desviación típica) de la media muestral de


incrementos salariales
b.2) ¿Cuál es la probabilidad de que la media muestral sea igual o inferior a 10%?
b.3) ¿Cuál es la probabilidad de que la desviación estándar muestral sea superior
a 4.52%?

7. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de


una población normal con varianza 𝜎 2 = 6, tenga una varianza S2
a) Mayor que 9.1

b) Entre 3.462 y 10.745

8. Usted desea comprar neumáticos para su flota de automóviles. Para hacer una prueba
de duración, usted compra 10 neumáticos de B.F. Goodrich y 10 de Goodyear y los
somete a pruebas. Los registros obtenidos indican que las llantas B.F. Goodrich duran
un promedio 277 millas, con una desviación estándar de 4 millas, mientras que el
promedio y varianza de las llantas Goodyear son de 280 y 19, respectivamente.

a) ¿Cuál es la probabilidad de que el promedio de duración de las llantas B.F. Goodrich


no exceda en más de 2 millas a las llantas de Goodyear? Asumas que las
distribuciones de las poblaciones son normales con varianzas desconocidas pero
distintas.
b) Si usted, en la actualidad, usa la marca de llantas MB S.A. La cual en sus 10
automóviles da una varianza en cuanto a la duración de 3.97. ¿Cuál es la
probabilidad de la razón entre las varianzas encontradas entre la marca B.F.
Goodrich y lo que usted actualmente usa? Suponga normalidad y además que las
varianzas poblacionales son iguales.
9. Un economista piensa que el incremento salarial de los empleados del sector bancario
sigue una distribución normal con desviación típica 3.37. Se toma una muestra aleatoria
de 16 empleados del sector
a) Hallar la probabilidad de que la desviación típica muestral sea menor que 1.99
b) Hallar la probabilidad de que la desviación típica muestral sea mayor que 2.89
10. Dos muestras aleatorias de tamaños 𝑛1 = 20 y 𝑛2 = 9, se extraen de dos poblaciones
normales homocedásticas (varianzas iguales). Encontrar la probabilidad de que la
desviación estándar de la segunda muestra es menor que la desviación estándar de la
primera
11. Sea 𝑥1 , 𝑥2 ,… 𝑥17 , una m.a. extraída de una población N(μ, 𝜎 2 ). Hallar el valor de
k tal que P(𝑋̅ > μ + kS)= 0.95.
12. Sea 𝑥1 , 𝑥2 , una m.a. extraída de una población N(0, 𝜎 2 ). Hallar
(𝑥 +𝑥 )2
P((𝑥1 −𝑥2 )2 < 4)
1 2

13. Sea 𝑥1 , 𝑥2 …,𝑥5 una m.a. extraída de una población N(0, 1). Determine la
constante C de modo que la variable
EE517-1453-INFERENCIA ESTADÍSTICA

𝐶(𝑥1 +𝑥2 )
V= ⁄1 , tenga distribución T-student
(𝑋32 +𝑋42+𝑋52) 2

14. Sean 𝑧1 , 𝑧2 , 𝑧3 , una m.a. extraída de una población N (0.1) y 𝑥1 , 𝑥2 , 𝑥3 , una m.a.
extraída de una población N(1,1). Suponiendo que las muestras son
2
independientes. Hallar la distribución de 3[(𝑥 − 1)2 + 𝑧 2 ] R. :𝑋(2)
15. Al someter a prueba 10 focos de linternas se obtienen las siguientes duraciones
en horas 40, 15, 23, 17, 9, 35, 26, 12, 10, 37. Se sabe, además, que los tiempos
de duración de los focos se distribuyen normalmente ¿Cuál es la probabilidad de
que la media muestral se desvíe en más de 5 de la media poblacional?
16. Se supone que la varianza de los puntajes de una prueba de aptitud es la misma
para hombres y mujeres. Una m.a. de 21 hombres y una m.a. independiente de
19 mujeres dan varianzas de 876 y 400, respectivamente. Si los puntajes para
hombres y mujeres están normalmente distribuidos y tienen varianzas iguales.
¿Cuál es la probabilidad de obtener una razón entre las varianzas tan grandes
como estos?
17. Un especialista en recreación, al estudiar el tiempo que gastan los turistas con
dos tipos de atracciones, examino una muestra de 10 turistas de cada tipo de
atracción. El tiempo medio gastado por la muestra de turista del tipo A fue de 55
minutos y por la muestra de turistas del tipo B, 49 minutos, ¿Cuál es la
probabilidad de observar una diferencia muestral tan grande como esta, si no
hay ninguna diferencia en el tiempo promedio y variabilidad verdadera gastada
por los turistas en los dos tipos de atracciones y si además la desviación estándar
es de 15 minutos para cada muestra? Suponga que los tiempos que gastan los
turistas tienen una distribución normal.
18. En una estación agrícola se deseaba ensayar el efecto de un determinado
fertilizante sobre la producción de maíz. Para ello, se eligieron 24 parcelas de
terreno de igual superficie, la mitad de ellas fueron tratados con el fertilizante y
la otra mitad (grupo control). Todas las demás condiciones fueron las mismas. La
media de maíz conseguida en las parcelas no tratadas fue de 4.8 fanegas con una
desviación estándar de 0.40 fanegas, mientras que la media en las parcelas
tratadas fue de 5.1 fanegas con una desviación estándar de 0.36 fanegas. ¿Cuál
es la probabilidad de observar una diferencia entre medias muestrales tan
grande o mas grande que la que se acaba de anotar, si se supone que las
varianzas poblacionales son desconocidas y distintas, y no hay ninguna diferencia
en el promedio verdadero de producción entre las parcelas?
19. Sean 𝑥1 , 𝑥2 variables aleatorias independientes distribuidos con 𝑥𝑛21 𝑦 𝑥𝑛22 ,
respectivamente y para dos constantes cualesquiera 𝐶1 𝑦 𝐶2 Sea X=𝐶1 𝑋1 +𝐶2 𝑋2 .
¿Bajo qué condiciones sobre las constantes C la variable aleatoria X tiene
distribución 𝑥𝑛21 También especifique r.
20. Suponga que los tiempos requeridos por un cierto autobús para alcanzar uno de
sus destinos en una ciudad grande forman una distribución normal con una
EE517-1453-INFERENCIA ESTADÍSTICA

desviación estándar σ = 1minuto. Si se elige al azar una muestra de 17 tiempos,


encuentre la probabilidad de que la varianza muestral sea mayor que 2.
21. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de
una población normal con varianza 𝜎 2 =6, tenga una varianza muestral.
a. Mayor que 9.1 b. Entre 3.462 y 10.745
22. Se supone que el peso de unos insectos de determinada especie está
normalmente distribuido con una desviación estándar de 0.7 gramos. Si estas
suposiciones son correctas. ¿Cuál es la probabilidad de que una muestra
aleatoria de 10n insectos arroje una varianza mayor o igual a 0.85?
23. La temperatura de encendido de un interruptor controlado termostáticamente
se distribuye normalmente con media y varianza desconocidas. Se va a tomar
una muestra aleatoria y determinar la varianza muestral. ¿Cuántas
observaciones son necesarias para asegurar que:
𝑆2
P[𝜎2 ≤ 1.83]≥0.99?

24. El gerente de una refinería piensa modificar el proceso para producir kerosene a
partir de petróleo crudo. El gerente hará la modificación solo si el kerosene
promedio que se obtiene por este nuevo proceso (expresada como un
porcentaje de crudo) aumenta su valor con respecto al proceso en uso. Con
base en un experimento de laboratorio y mediante el empleo de dos muestras
aleatorias de tamaño 12, una para cada proceso, la cantidad de kerosene
promedio del proceso en uso es de 24.6 con una desviación estándar de 2.7. El
gerente piensa que los resultados proporcionados por los dos procesos son
variables aleatorias normalmente distribuidos con varianzas iguales. Con base en
esta evidencia. ¿Debe adoptarse el nuevo proceso?
25. Supongamos que el punto (X; Y; Z) es elegido al azar en R 3 donde X; Y; Z, son v.a.
independientes distribuidas como N (0,1), ¿Cuál es la probabilidad de que la
distancia entre el origen y el punto sea menor que 1.916?
26. Cuando el movimiento de una partícula microscópica es observado en un líquido
o un gas, es evidente que el movimiento es irregular porque la partícula
frecuentemente choca con otras partículas. El modelo de probabilidad para este
movimiento, el cual es llamado movimiento Browniano, es el siguiente:
supongamos que un sistema de coordenadas es elegido en el liquido o gas, y
supongamos además que la partícula esta en el origen de este sistema en el
tiempo t=0. Si (X; Y; Z) denota las coordenadas de la partícula en cualquier
tiempo t>0, entonces las variables aleatorias X, Y, Z, son independientes e
idénticamente distribuidas, cada una de ellas con distribución normal con media
0 y varianza 𝜎 2 𝑡. Encontrar la probabilidad de que en t = 2, la particular estará
dentro de una esfera de centro el origen de coordenadas y radio 4 σ.
EE517-1453-INFERENCIA ESTADÍSTICA

27. Si 𝑠12 y 𝑠22 representan las varianzas de muestras aleatorias independientes de


tamaño 𝑛1 = 8 y 𝑛2 = 12, tomadas de poblaciones normales con varianzas
iguales, encuentre P (𝑠12 / 𝑠22 < 4.89)
28. De 120 alumnos la proporción de que tengan 2 o más hermanos es de 48/120.
Indica los parámetros de distribución a la que se ajustaran las muestras de
tamaño 30.
EE517-1453-INFERENCIA ESTADÍSTICA

SEMANA 5
EE517-1453-INFERENCIA ESTADÍSTICA

EJERCICIOS
1. Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren
en sus opiniones sobre la promulgación de la pena de muerte para personas

culpables de asesinato. Se cree que el 12% de los varones adultos están a favor
de la pena de muerte, mientras que solo el 10% de las mujeres adultas lo están.
Si se pregunta a dos muestras aleatorias de 100 varones y 100 mujeres su opinión
sobre la promulgación de la pena de muerte. Determine la probabilidad de que
el % de varones a favor sea al menos 3% mayor que el de las mujeres.

2. Se sabe que el 20% de trabajadores de lima que fueron despedidos entre 1979
y 1984, habían estado sin trabajo durante por lo menos 2 años. Dos empresas
realizan encuestas independientemente dirigido a 320 trabajadores cada uno.
¿Cuál seria la probabilidad de que los porcentajes muestrales de trabajadores sin
empleo durante por lo menos dos años obtenidos por ambas empresas difieran
en 5% o más.
EE517-1453-INFERENCIA ESTADÍSTICA

DISTRIBUCION CHICUADRADO

Definición 1:
Sea Z~ N (0,1) ∧ x=Z2, se dice que X tiene una distribución CHI-CUADRADO con un
grado de libertad y se simboliza:
2
X ~ 𝑋(1)

Definición 2:

Sea W~ N (μ,𝜎 2 ) entonces:


𝑤−𝜇
~ N (0,1)
𝜎

𝑤−𝜇 2 2
X=( 𝜎
) ~ 𝑋(1)

Definición 3:
Sea 𝑤1 , 𝑤2 , 𝑤3 ……𝑤𝑛 una sucesión de v.a. distribuidas N (𝜇𝑖 , 𝜎2𝑖 ), respectivamente es
independiente, entonces.
𝑤𝑖 −𝜇𝑖 2 2
X = ∑( ) ~ 𝑋(𝑛)
𝜎𝑖

Si:
𝜇𝑖 = 𝜇 ∧ 𝜇𝑖 = 𝜇

𝑤𝑖 −𝜇 2 2
X = ∑( ) ~ 𝑋(𝑛)
𝜎

FUNCION DE DISTRIBUCION ACUMULATIVA

𝑥 𝑛 −𝑥2
1
F(X) = P(X≤x) = ∫0 .(𝑥 2 ) 2 −1 .𝑒 2 dx
𝜏(𝑛/2)2𝑛/2

E(x)=n n=2 n=4


V(x)=2n
n=15
EE517-1453-INFERENCIA ESTADÍSTICA

Manejo de tabla
2
1) Si X ~ 𝑋(25) Calcular:

a) P(X≤28.2)
b) P(26.1≤X≤40.6)
c) P(X≤30)
d) P(35≤X≤50)
e) P(18.5<X<27.4)

2
2) Si X ~ 𝑋(30) Calcular “C” si:
a) P(x<c) = 0.20
b) P(x<c) = 0.25
c) P(x<c) = 0.88
TEOREMA DE COCHRAN

Sea 𝑥1 , 𝑥2 , 𝑥3 ……𝑥𝑛 , una muestra aleatoria extraída de una población N (μ, σ2),
entonces.
σ2
1) 𝑥̅ ~N (μ, )
𝑛
𝑥𝑖 −𝑥̅ 2
2) Los estadísticos 𝑥̅ y ∑( ) son independientes
𝜎2
3) El estadístico
𝑥𝑖 −𝑥̅ 2 2
∑( ) ~𝑋(𝑛−1)
𝜎2

DISTRIBUCION DE LA VARIANZA MUESTRAL


Sea 𝑥1 , 𝑥2 , 𝑥3 ……𝑥𝑛 , una muestra aleatoria extraída de una población N (μ, σ2),
Tenemos los estadísticos
𝑥̅ =∑ 𝑥𝑖 S2 = ∑(𝑥𝑖 − 𝑥̅ )2
𝑛 𝑛-1
Objetivo

Conocer la distribución de S2 por el teorema de Cochran

𝑥𝑖 −𝑥̅ 2 2
∑( 2 ) ~𝑋(𝑛−1)
𝜎
EE517-1453-INFERENCIA ESTADÍSTICA

𝑛−1 (𝑛−1)𝑆 2
. =
𝜎2 𝜎2

(𝑛−1)𝑆 2 2
Luego W=
𝜎2
~𝑋(𝑛−1)

E(w)=n-1

V(w)=2(n-1)

El resultado es usado cuando las muestras son pequeñas.

EJEMPLO

1. Se toma una muestra aleatoria de tamaño 16 de una población normal que tiene
𝜎 2 =5. Encuentre la probabilidad de que la varianza de la muestra sea menor o igual
que 7.44
SOLUCION
(𝑥1 , 𝑥2 , 𝑥3 ……𝑥16 ) m.a. X~𝑁(μ, 5)
P(S2≤7.44) =??
(𝑛−1)𝑆 2 7.44(15)
P(S2≤7.44) = P ( 𝜎2
≤ )
5
2
=P (𝑋(15)≤22.32) ≈0.90

2. Sea (𝑦1, 𝑦2 ) una m.a. de una distribución N (μ, σ2)


𝑦1 −𝑦
2 2
¿Qué distribución tiene el estadístico ( ) =
√2𝜎

Solución

𝑦1 ~N (μ, σ2)

𝑦2 ~N (μ, σ2)
𝑦1 − 𝑦2 ~N (0, 2σ2)

𝑦1 −𝑦 −0
2
Luego Z= ( ) ~ N (0, 1)
√2𝜎
𝑦1 −𝑦 2
2 2
Z2= ( ) ~ 𝑋(1)
√2𝜎

2
3. Si, X~𝑋(𝑛) , Hallar n tal que P(X≥16.3) = 0.7
SOLUCIÓN

P(X≥16.3) = 1 – P(X<16.3) = 0.7

P(X<16.3) = 0.3

Por lo tanto 𝑛= 20gl


EE517-1453-INFERENCIA ESTADÍSTICA

4. Sea (𝑦1, 𝑦2 ), una m.a. de tamaño 2 de una distribución Normal, con media μ y
varianza σ2, verifique que:
𝑦1 −𝑦2
W= , tiene distribución Normal estándar.
√2𝜎

SOLUCION
𝑦1 −𝑦2 1
E(W) = E ( )= E (𝑦1 − 𝑦2 )
√2𝜎 √2𝜎

1
= [𝐸 (𝑦1 ) − 𝐸(𝑦2 )]
√2𝜎

1
= (0) = 0
√2𝜎
𝑦1 −𝑦 1
2
V(W) = V ( )= V (𝑦1 − 𝑦2 )
√2𝜎 2𝜎2

1
= [𝑉 (𝑦1 ) + 𝑉(𝑦2 )]
2𝜎2

1 1
= (𝜎 2 + 𝜎 2 ) =2𝜎2 . 2𝜎 2 = 1
2𝜎2

Por lo tanto W ~ N (0, 1)


EE517-1453-INFERENCIA ESTADÍSTICA

EJERCICIOS

A. LECTURA DE LA TABLA X2 CON (JI - CUADRADA)

1. Dadas las distribuciones de X2 con k=15, k=21 y k=50 grados de libertad.

a. Calcular los valores críticos de X2 correspondientes a α = 0.05.


b. Calcular los valores medianos, para las tres distribuciones.
2. La grafica de una distribución X2, con k=5 grados de libertad es:
f(X2)

A B
X2
Se designa por A, el área sombreada de la izquierda, Se designa por B el área
sombreada de la derecha.

Encontrar los valores críticos 𝑥α2 de 𝑥 2 para los cuales.


a) El área de B es igual a 0.05
b) El área B es igual a 0.10
c) El área B es igual a 0.01

3. Se toma una muestra aleatoria de n=25 observaciones de una población normal que
tiene una varianza 𝜎 2 = 10, encuentre la probabilidad de que la varianza muestral
S2, sea mayor que 16.4.

4. Si se obtiene una muestra aleatoria de n=16 de una distribución normal, con


𝑆2
media y varianza desconocida. Obtener P ( ≤ 2.041)
𝜎2

5. Para un gerente de planta es muy importante controlar la variación en el espesor de


un material plástico. Se sabe que la distribución del espesor del material es normal
con una desviación estándar de 0.01cm. Una m.a. de 25 piezas de este material da
como resultado una desviación estándar muestral de 0.015cm. Si la varianza de la
población es (0.01)2cm2. ¿Cuál es la probabilidad de que la varianza muestral sea
igual o mayor que (0.015)2cm2
EE517-1453-INFERENCIA ESTADÍSTICA

B. Lectura de tabla de T-STUDENT

6. El grafico de una Distribución T- STUDENT con k=9 grados de libertad es:

Se designa por A el área sombreada de la izquierda. Se designa por B el área


sombreada de la derecha.

Encontrar los valores de T tales que:

a) El área B es igual a 0,05;


b) El área A+B = 0.05;
c) El área ̅̅̅̅̅̅̅̅
𝐴 + 𝐵 = 1 – (A+B) igual a 0,995
d) El área A es igual a 0,01
e) El área (1- B) es igual a 0.90.

7.
a. Dada una distribución Normal, estandarizada, calcular el valor de T
correspondiente a un intervalo de confianza del 95% y 99%.
b. Dada un Distribucion T Student con k=1 grado de libertad, calcular el valor de T
correspondiente a un intervalo de confianza del 95% y 99%.
c. Las mismas preguntas para k=5, k=10, k=20 y k=30.
C. LECTURA DE LA TABLA F DE FISHEY-SNEDECOR.

8. Para una Distribucion F, encuentre lo siguiente:

a)𝑓0.25 ; 4,9
b) 𝑓0.05 ; 15,10
b) 𝑓0.95 ; 6,8
b) 𝑓0.90 ; 24,24

9. Si 𝑆12 , 𝑆22 son las varianzas muestrales aleatorias independientes de tamaño 𝑛1 =10 y
𝑛2 =20, tomadas de poblaciones normales que tienen las mismas varianzas, encuentre:
𝑆12
P( ≤ 2.42)
𝑠22
EE517-1453-INFERENCIA ESTADÍSTICA

DISTRIBUCION F
2 2

Sean las V.A. X~𝑋𝑚 y W~𝑋𝑛 independientes


La v.a.
𝑋
𝑚
F= 𝑤 ~𝐹(𝑚,𝑛)
𝑛

Se dice que la V.A. tiene distribución F de Fisher con m y n grados de libertad.


GRAFICA

𝐹(𝑚,𝑛)

Característica
𝑛
E(F) = sí n >2
𝑛−2

2𝑛(𝑛+𝑚−2)
V(F) = sí n >4
𝑚(𝑛−2)2 (𝑛−4)

MANEJO DE TABLA

Si X~𝐹(10,5) Halla 𝑋0

i. P (𝑋 < 𝑋0 ) = 0.95 → 𝑋0 = 4.74

ii. P (𝑋 > 𝑋0 ) = 0.25

1 - P (𝑋 ≤𝑋0 ) = 0.25

P (𝑋 ≤𝑋0 ) = 0.75

→ 𝑋0 = 1.89

iii. Si X~𝐹(11,20)

Hallar P(X ≥2 )

P(X ≥2 ) = 1 - P (𝑋 <2)
=1–
INTERPOLACION
F P
1.91 0.90
2.00 X
2.31 0.95
2 - 1.91 = X – 90
2.31 – 1.91 0.95-0.90
X=
EE517-1453-INFERENCIA ESTADÍSTICA

iv. Sea 𝑥1 , 𝑥2 una m.a. extraída de una población N (0,𝜎 2 )

Hallar:
(𝑥1 +𝑥2 )2
P( < 4)
(𝑥1 −𝑥2 )2

𝑥1 ~ N (0,𝜎 2 )
𝑥2 ~ N (0,𝜎 2 )
𝑥1 + 𝑥2 ~ N (0, 2𝜎 2 )
𝑥1 − 𝑥2 ~ N (0, 2𝜎 2 )
𝑥1 −𝑥2 𝑥1 +𝑥2
~ N (0,1) ~ N (0,1)
√2𝜎2 √2𝜎

2 2
𝑥1 −𝑥2 2 𝑥1 +𝑥2 2
( ) ~ 𝑋(1) ( ) ~ 𝑋(1)
√2𝜎2 √2𝜎

2
𝑥 +𝑥 (𝑥1+𝑥2)
( 1 2 )2 (𝑥1 +𝑥2 )2
√2𝜎 2𝜎2
𝑥1−𝑥2 = 2 = ~ 𝐹(1,1)
( ) 2 (𝑥1−𝑥2) (𝑥1 −𝑥2 )2
√2𝜎
2𝜎2

P (𝐹(1,1) < 4) =

INTERPOLACION
F P
1.00 0.50
4 X
5.83 0.75

DISTRIBUCION MUESTRAL DE LA RAZON DE VARIANZAS


Sean 𝑥1 , 𝑥2 , 𝑥3 , … . 𝑥𝑛1 una m.a. extraída de una población N (𝜇1 ,𝜎12 ), y 𝑦1, 𝑦2 , 𝑦3 , … . 𝑦𝑛2 una
m.a. extraída de una población N (𝜇2 ,𝜎22 ). Ambas poblaciones independientes.

𝑠12
OBJETIVO: Conocer la distribución
𝑠22

SABEMOS
(𝑛1 −1)𝑠12 2
~ 𝑋(𝑛 1 −1)
𝜎12

(𝑛2 −1)𝑠22 2
~ 𝑋(𝑛 2 −1)
𝜎22

CONSTRUIMOS

(𝑛1−1)𝑠2
1
𝜎2
1
(𝑛2−1)𝑠2
~ 𝐹(𝑛1−1,𝑛2 −1)
2
𝜎2
2
EE517-1453-INFERENCIA ESTADÍSTICA

𝑠2
1
𝜎2
1
𝑠2
~ 𝐹(𝑛1−1,𝑛2−1)
2
𝜎2
2

En particular 𝜎12 = 𝜎22 Homocedastica

𝑠12
~ 𝐹(𝑛1 −1,𝑛2−1)
𝑠22

EJEMPLO
1) La afirmación de que la varianza de una población normal es σ2 = 25, se rechazara si la
varianza de una m.a. de tamaño 16 excede 54,668 o es menor que 12.102.
¿Cuál es la probabilidad de que se rechace esta afirmación, aunque σ2 = 25?

SOLUCION

= P (RECHAZAR AFIRMACION)

= P (S2 >54,668 o S2 <12,102)

P(S2 >54,668) +P(S2 <12,102)


2 54,668(15) 2 12,102(15)
P(𝑋15 > ) + P(𝑋15 < )
25 25
2 2
P(𝑋15 > 32.80) + P(𝑋15 < 7.26)
2 2
1 - P(𝑋15 ≤32.80) + P(𝑋15 < 7.26)

1 – 0.995 + 0.05

2) Dos muestras aleatorias independientes de tamaño 21 y 9, respectivamente se toman


de una misma población que esta normalmente distribuida ¿Cuál es la probabilidad de
que la varianza de la primera muestra sea al menos el cuádruple de la varianza de la
segunda

X ~N (μ, σ2)
𝑛1 =21 𝑛2 =9
𝑠12 𝑠12
P (𝑠12 ≥ 4𝑠22 ) = P( ≥ 4) = 1 - P( < 4)
𝑠22 𝑠22

= 1 – P (𝐹(20,8) <4)

= 1 – 0.975

= 0.025
EE517-1453-INFERENCIA ESTADÍSTICA

EJERCICIOS

1) Para una distribución F encuentre lo siguiente

a) 𝐹(0.25,4,9) b) 𝐹(0.05,15,10) c) 𝐹(0.95,6,8) d) 𝐹(0.90,24,24)

2) Si 𝑠12 y 𝑠22 son las varianzas muestrales de muestras aleatorias independientes de


tamaño 𝑛1 = 10 y 𝑛2 = 20, tomadas de poblaciones normales que tienen las mismas
𝑠12
varianzas encuentre P ( ≤ 2.42).
𝑠22

3) Si 𝑠12 y 𝑠22 son las varianzas de V.A.I. de una muestra aleatoria de tamaño 𝑛1 = 61 y 𝑛2 =
31 de poblaciones normales con 𝜎12 =12, 𝜎22 =18, Determine:
𝑠12
P( > 1.16).
𝑠22
EE517-1453-INFERENCIA ESTADÍSTICA

SEMANA 6
EE517-1453-INFERENCIA ESTADÍSTICA

TEORIA DE ESTIMACION

La estimación estadística consiste en utilizar datos muestrales para determinar los


valores de parámetros desconocidos de una población.

Se denomina estimador puntual de un parámetro (𝜃̂) a cualquier variable aleatoria que


se exprese en función de la muestra aleatoria y que tenga por objetivo aproximar el
valor del parámetro desconocido.
TIPOS DE ESTIMACIÓN

PUNTUAL. – Utilizar un solo valor de (𝜃̂) para aproximar el valor del parámetro.
INTERVALOS DE CONFIANZA
Esto es la estimación que incluye un intervalo de valores posibles en la que se considera
que está comprendido el valor verdadero del parámetro de la población

EJEMPLOS
1) De una misma m.a. se obtiene 𝑝̂ =0.90 sea, 𝑝̂ : proporción de ingresantes por
2da opción a la carrera de matemática.
Se trata de una Estimación Puntual pero no sabemos que tan preciso es este
resultado.
2) De una m.a. se encontró que la verdadera proporción oscila entre <0.90,0.94>
con un nivel de confianza del 95%.
No toda función de la muestra es un buen estimador del parámetro, un buen
estimador es aquel que está más cerca del parámetro que se estima.
Para que un estimador puntual sea bueno debe tener ciertas propiedades.

PROPIEDADES DE UN BUEN ESTIMADOR


1.- INSESGADO
Se dice que el estadístico 𝜃̂= 𝑓(𝑥1 , 𝑥2 , 𝑥3 , … . , 𝑥𝑛 ) es un estimador insesgado del
parámetro 𝜃 si:
𝐸(𝜃̂)= 𝜃
En caso contrario se dice que es un estimador sesgado
Sesgo B= 𝐸(𝜃̂)= 𝜃

EJEMPLOS

1) Los momentos muestrales con respecto al origen son estimadores


insesgados
2) E(𝑥̅ ) = μ entonces 𝑥̅ es un estimador insesgado de μ
E(𝑝̅ )= π entonces 𝑝̅ es un estimador insesgado de π
EE517-1453-INFERENCIA ESTADÍSTICA

3) Sea 𝑥1 , 𝑥2 , 𝑥3 , … . , 𝑥𝑛 una m.a. extraída de una población N(μ,𝜎 2 ) Estudiar la


insesgabilidad de:

Probar
(𝑛−1)𝜎2
E(S2) = E[(𝑛−1)𝜎2 ]

(𝑛−1)𝑆2 .𝜎2
= E[ ]
𝜎2 .(𝑛−1)

𝜎2 (𝑛−1)𝑆 2 𝜎2 2
= (𝑛−1). E[ ]= .E(𝑋𝑛−1 )
𝜎2 (𝑛−1)

𝜎2
E(S2) = (𝑛−1) . (𝑛 − 1)

E(S2) = 𝜎 2
Por lo tanto, S2 es un estimador Insesgado de 𝜎 2
(𝑛−1) (𝑛−1)
E (𝜎̂ 2 ) = E [ ]=E[ ]
(𝑛−1) 𝑛

(𝑛−1) (𝑛−1)
= 𝑛
E(S2) = 𝑛
𝜎2
𝑛−1
E (𝜎̂ 2 ) = 𝜎2
𝑛

Por lo tanto 𝜎̂ 2 no es un estimador insesgado de 𝜎 2

4) Suponga que 𝑥1 , 𝑥2 , 𝑥3 , … . , 𝑥𝑛 es una m.a. de una V.A. N (μ,𝜎 2 )

a. Determine C tal que:


T= C[(𝑥1 − 𝑥2 )2 + (𝑥3 − 𝑥4 )2 +(𝑥5 − 𝑥6 )2 + (𝑥7 − 𝑥8 )2 ]
Sea un estimador insesgado de 𝜎 2
Solución
E(T) = 𝜎 2

𝜎 2 = E(X2) – [𝐸(𝑥)]2
E(X2) = 𝜎 2 + μ2
E(T) = E{𝐶 [(𝑥1 − 𝑥2 )2 + (𝑥3 − 𝑥4 )2 +(𝑥5 − 𝑥6 )2 + (𝑥7 − 𝑥8 )2 ]}
EE517-1453-INFERENCIA ESTADÍSTICA

C{𝐸 [(𝑥1 − 𝑥2 )2 + (𝑥3 − 𝑥4 )2 +(𝑥5 − 𝑥6 )2 + (𝑥7 − 𝑥8 )2 ]}

C{𝐸 [𝑥1 2 + 𝑥2 2 + 𝑥3 2 + 𝑥4 2 + 𝑥5 2 + 𝑥6 2 + 𝑥7 2 + 𝑥8 2 ] −
2[𝑥1 𝑥2 + 𝑥3 𝑥4 + 𝑥5 𝑥6 + 𝑥7 𝑥8 ]}
= C{[𝜎 2 + μ2 + 𝜎 2 + μ2 + 𝜎 2 + μ2 + 𝜎 2 + μ2 + 𝜎 2 + μ2 +
𝜎 2 + μ2 + 𝜎 2 + μ2 + 𝜎 2 + μ2 ] − 2(μ2 + μ2 + μ2 + μ2 )}
= C{[8𝜎 2 + 8μ2 ] − 2(4μ2 )}= c{8𝜎 2 }

𝜎 2 = 8c𝜎 2
C= 1/8
ESTIMADOR ASINTOTICAMENTE INSESGADO

lim 𝐸(𝜃̂) = θ
𝑛→∞
∑𝑥
Sea T= 𝑛+3𝑖

Dado una m.a. extraída de una población con parámetro μ,𝜎 2


Probar que T es un estimador asintóticamente insesgada
∑𝑥 1
E(T) = E (𝑛+3𝑖 ) = 𝑛+3 E (∑ 𝑥𝑖 )
1
=𝑛+3 ∑ 𝐸(𝑥𝑖 )
1 𝑛.μ
= 𝑛.μ =
𝑛+3 𝑛+3
𝑛
Aplicando lim μ=μ
𝑛→∞ 𝑛+3

Por lo tanto, T es un estimador asintóticamente insesgado de μ


2.-ESTIMADOR EFICIENTE
2.1 EFICIENCIA RELATIVA

Dado 2 estimadores Insesgados 𝑇1 y 𝑇2 decimos que 𝑇1 es más


eficiente que 𝑇2 si:
V (𝑇1) < V (𝑇2)
2.1 EFICIENCIA ABSOLUTA
Un estimador tiene eficiencia absoluta o es de varianza mínima. Si tiene
la menor varianza entre todos los estimadores Insesgados de un
parámetro θ
Se determina con la cota de Cramer – Rao.
EE517-1453-INFERENCIA ESTADÍSTICA

1
V(𝜃̂) = 𝜕𝑙𝑛𝑓(𝑥,𝜃) 2
𝑛𝐸[ ]
𝜕𝜃

1
V(𝜃̂) = 𝜕𝑙𝑛𝑓(𝑥,𝜃) 2
𝑛𝐸[ ]
𝜕𝜃

Como 𝑓(x, θ) densidad de la población al denominador se le conoce como


información sobre θ que proporciona la muestra.
EJEMPLO
Considere una población con distribución de Poisson P(λ)
Comprobar que 𝑥̅ es un estimador eficiente de λ
λ
i) E (𝑋̅)= λ V (𝑋̅)=
𝑛
𝑥
𝑒 −λ .λ
ii) P(X, λ)= 𝑥!

LnP(x, λ) = - λ + xLn λ - lnx!


𝜕𝑙𝑛𝑃(𝑥,λ) 𝑥
= -1 +λ
𝜕λ

𝑥 2 𝑥−λ 2
E(−1 + ) = E( )
λ λ
1 1 2
= 2.E(𝑥 − λ)2 = 2.E(𝑥 2 − 2𝑥λ + λ )
λ λ
1 2
= [E(𝑥 2 ) − 2 λ E(x) + E(λ )]
λ2
1 2 2 1
= [λ + λ − 2λ λ + λ ] = (λ)
λ2 λ2
1
=
λ
1 𝜆
V(𝜃̂)= 1 =𝑛
𝑛( )
λ

𝜆
Como V(𝑋̅) =
𝑛

Entonces 𝑥̅ es el estimador de mínima varianza de λ

CONSISTENCIA

Sean, 𝜃̂1, 𝜃̂2 , 𝜃̂3 , 𝜃̂4 ,……. 𝜃̂𝑛 una sucesión de estimadores de θ donde 𝜃̂1 es un
estimador obtenido de una m.a. de tamaño 1, 𝜃̂2 es un estimador obtenido de un m.a.
de tamaño 2, 𝜃̂𝑛 es un estimador obtenido de una m.a. de tamaño n. Se dice que 𝜃̂𝑛 es
un estimador consistente de θ si ∀ ϵ>0 se verifica que:
̂𝑛 − θ| < ϵ]=1
lim 𝑃[|𝜃
𝑛→∞

En forma practica
EE517-1453-INFERENCIA ESTADÍSTICA

Mientras mas grande sea la muestra la estimación mejorara

Se dice que 𝜃̂𝑛 es un estimador consistente de:

i) lim 𝐸(𝜃̂𝑛 ) = θ
𝑛→∞
ii) lim 𝑉(𝜃̂𝑛 ) = 0
𝑛→∞
EE517-1453-INFERENCIA ESTADÍSTICA

EJEMPLO
Pruebe si 𝑥̅𝑛 es un estimador consistente de μ de la población es normal.
∑ 𝑥𝑖
𝑥̅𝑛 = 𝑥̅ = 𝑛

𝑥 𝑥2 +𝑥3 𝑥1 +𝑥2 +𝑥3 𝑥1 +𝑥2 +𝑥3+⋯+𝑥𝑛 ∑ 𝑥𝑖


𝑥̅1 = 11 𝑥̅2 = 𝑥̅3 = …………………………𝑥̅𝑛 = =
2 3 𝑛 𝑛

lim 𝐸(𝑥̅𝑛 ) = μ
𝑛→∞

𝜎2
lim 𝑉(𝑥̅𝑛 ) = lim =0
𝑛→∞ 𝑛→∞ 𝑛

2.) Muestre que S2 es un estimador consistente de 𝜎 2 , en una población normal

i) lim 𝐸(𝑆 2 ) = 𝜎 2
𝑛→∞

(𝑛−1)𝑆 2 𝜎2
ii) lim 𝑉(𝑆 2 )= lim 𝑉( . 𝑛−1)
𝑛→∞ 𝑛→∞ 𝜎2

2 𝜎2
= lim 𝑉(𝑋𝑛−1 . )
𝑛→∞ 𝑛−1

𝜎4 2
= lim ( )V(𝑋𝑛−1 )
𝑛→∞ (𝑛−1)2

𝜎4
= lim ( )2(n-1)
𝑛→∞ (𝑛−1)2

2𝜎4
= lim ( ) =0
𝑛→∞ 𝑛−1

METODO PARA ENCONTRAR ESTIMADORES

MÉTODO DE MÁXIMA VEROSIMILITUD

Este método nos proporciona como estimador de Máxima verosimilitud (EMV) a aquel que
haga máxima la probabilidad de ocurrencia de la muestra.

FUNCION DE VEROSIMILITUD

Sea (𝑥1 , 𝑥2 , 𝑥3 , … . . 𝑥𝑛 ,) una m.a. extraída de una población con densidad 𝑓(𝑥, 𝜃) y
(𝑥1 , 𝑥2 , 𝑥3 , … . . 𝑥𝑛 ,) un conjunto de observaciones.

La función de Verosimilitud es la función de densidad conjunta de la m.a. y del parámetro 𝜃

L(θ) = L (θ,X) =𝑓(𝑥1 , 𝑥2 , 𝑥3 , … . . 𝑥𝑛 , θ)

= 𝑓(𝑥1 , θ), 𝑓(𝑥2 , θ), 𝑓(𝑥3 , θ),…., 𝑓(𝑥𝑛 , θ)

ESTIMADOR DE MAXIMA VEROSIMILITUD

El estimador T = t (𝑥1 , 𝑥2 , 𝑥3 , … . . 𝑥𝑛 ,) es un EMV, Si el Supremo de L (θ) se obtiene al hacer θ=T


EE517-1453-INFERENCIA ESTADÍSTICA

El método de máxima verosimilitud consiste en tomar como valor estimado de θ el valor


que hace máxima a la función L (θ) o ln L (θ).

Se determina θ por la ecuación:

𝜕L (θ) 𝜕𝑙𝑛L (θ)


=0 ó =0
𝜕 (θ) 𝜕 (θ)

EJEMPLOS

1) Se toma una muestra de tamaño 3 de una población con distribución de Poisson de


parámetro λ, cuyos resultados son:
𝑥1 = 2 𝑥2 = 0 𝑥3 = 5
Determinar el EMV de λ

L (λ) = L (x,λ) = p(𝑥1 , 𝑥2 , 𝑥3 ; λ)

= p (𝑥1 , λ) p (𝑥2 , λ) p (𝑥3 , λ)

= ∏3𝑖=1 𝑝(𝑥𝑖 , λ)
𝑒 −λ .λ𝑥𝑖
= ∏3𝑖=1
𝑥𝑖 !

𝑒 −3λ.λ𝑥1+𝑥2 +𝑥3
=
𝑥1 !𝑥2 !𝑥3 !

ln (L (x,λ))= -3 λ + (𝑥1 + 𝑥2 + 𝑥3 )ln λ – ln(𝑥1 ! 𝑥2 ! 𝑥3 !)


𝜕𝑙𝑛L (x,λ) (𝑥 +𝑥 +𝑥 )
= -3 + 1 2 3
𝜕 (λ) λ

Igualando a cero
(𝑥1 +𝑥2 +𝑥3 )
-3 + =0
λ

(𝑥1 +𝑥2 +𝑥3 )


=3
λ

(𝑥 +𝑥 +𝑥 )
λ̂ = 1 2 3
λ

λ̂ = 𝑥̅
2++0+5
λ̂ = = 7/3
3

2) Sea 𝑥1 , 𝑥2 , 𝑥3 , … . . 𝑥50 una m.a. de tamaño 50 escogida de una población con


distribución geométrica de parámetro π 0< π<1
P(X=x) = π(π(1 − π))𝑥 x= 0,1,2, 3,……
a) Determinar un estimador de máxima verosimilitud.
b) Estimar π si 𝑥1 + 𝑥2 + 𝑥3 … . . +𝑥50 =100
EE517-1453-INFERENCIA ESTADÍSTICA

SOLUCION

L (π) = ∏50
𝑖=50(π(1 − π))
𝑥𝑖

50
L (π) = π50 (1 − π)∑𝑖=1 𝑥𝑖

ln L (π) = 50ln π + Σ𝑥𝑖 ln (1 − π)


𝜕𝑙𝑛L (π) 50 Σ𝑥𝑖
= –
𝜕 (π) π 1−π

Igualando a cero
50 Σ𝑥𝑖
– = 0
π 1−π

50 Σ𝑥𝑖
=
π 1−π

1−π ∑50 𝑥
= 𝑖=1 𝑖
π 50

1 ∑50 𝑥
-1= 𝑖=1 𝑖
π 50
1
-1 = 𝑥̅
π
1
= 𝑥̅ +1
π
1
= 𝜋̂
𝑥̅ +1
1 1
B) 𝜋̂ = ̅̅̅̅̅
100 =
+1 3
50

3) Sea 𝑥1 , 𝑥2 , 𝑥3 , … . . 𝑥𝑛 una m.a. extraída de una población con función de densidad


𝛼
𝑓(𝑥, 𝜃) = αθ𝑥 𝛼−1 𝑒 −𝜃𝑥 α >1 constante θ >0 x>0

Hallar el estimador de máxima verosimilitud de θ

Solución

L (θ) = 𝑓(𝑥1 , 𝑥2 , 𝑥3 , … . . 𝑥𝑛 ; 𝜃) = ∏𝑛𝑖=1 𝑓(𝑥𝑖 , 𝜃)


𝛼
= ∏𝑛𝑖=1 αθ𝑥𝑖 𝛼−1 𝑒 −𝜃𝑥𝑖
𝛼−1 𝛼
= α𝑛 θ𝑛 (∏𝑛𝑖=1 𝑥𝑖 ) . 𝑒 −θΣ𝑥𝑖

ln (L (θ)) = nlnα + nln θ + (𝛼 − 1). ∑ln𝑥𝑖 - θΣ𝑥𝑖 𝛼


𝜕𝑙𝑛L (θ) 𝑛
= - Σ𝑥𝑖 𝛼
𝜕 (θ) θ

𝑛 𝑛
Igualando a cero - Σ𝑥𝑖 𝛼 =0 → = Σ𝑥𝑖 𝛼
θ θ
𝑛
θ̂ =
Σ𝑥𝑖 𝛼
EE517-1453-INFERENCIA ESTADÍSTICA

EJERCICIOS
Determine el estimador de Máxima Verosimilitud de las siguientes distribuciones
|𝑥−𝜇|
1
1) 𝑓(𝑥) = 𝑒− 𝑏 del Parámetro b
2𝑏

𝑥2

𝑥.𝑒 2𝛿2
2) 𝑓(𝑥, 𝛿)=
𝛿2

𝑥
𝑥
3) 𝑓(𝑥) = . 𝑒 −𝜃 Si x>0 𝜃 > 0
𝜃2

𝜆𝛼 𝑥 𝛼−1 𝑒 −𝜆𝑥
4) 𝑓(𝑥, 𝛼, 𝜆)= con respecto a α, dado una muestra aleatoria de n elementos
𝜆𝛼
EE517-1453-INFERENCIA ESTADÍSTICA

SEMANA 7
EE517-1453-INFERENCIA ESTADÍSTICA

METODO DE MOMENTOS

Suponga que X es una V.A. continua con función de densidad 𝑓(𝑥1 𝜃1, 𝜃2 , 𝜃3 , 𝜃4 , … 𝜃𝑘 , )
ó una V.A. discreta con distribución de probabilidad p (𝑥1 𝜃1 , 𝜃2 , 𝜃3 , 𝜃4 , … 𝜃𝑘 )
caracterizado por k parámetros desconocidos sea 𝑥1 , 𝑥2 , 𝑥3 ,.. 𝑥𝑛 una m.a. de tamaño n
de X Los primeros K momentos muestrales alrededor

1
𝑀r0 =𝑛 ∑𝑛𝑖=1 𝑥𝑖 r 𝑟 = 1,2,3, … … k

Los primero K momentos poblacionales alrededor del origen.

𝑇r0 =E (𝑋 r )
El método de los momentos consiste en igualar los momentos muestrales y momentos
poblacionales obtenido K ecuaciones simultáneamente con K parámetros desconocidos

𝑀r0 =𝑇r0 r = 1,2,3, … … k


Y así hallaremos los estimadores de 𝜃1, 𝜃2 , 𝜃3 ,… 𝜃𝑘 respectivamente.
EJEMPLOS

Suponga que X es una V.A. distribuida Normalmente con media μ y varianza 𝜎 2


desconocidos. Encuentre los estimadores para μ y 𝜎 2 por el método de momentos.

SOLUCION

La distribución N(μ,𝜎 2 ) en consecuencia habrá 2 ecuaciones.


𝑇10 = E(X) = μ

𝑇20 = E(X2) = 𝜎 2 + μ2

Sea 𝑥1 , 𝑥2 , 𝑥3 ,.. 𝑥𝑛 una m.a. de X, los 2 primeros momentos muestrales.


1
𝑀10 = 𝑛 Σ𝑥𝑖
1
𝑀20 = 𝑛 Σ𝑥𝑖 2

Igualando el 1er Momento Poblacional y el 1er Momento Muestral.


μ = 𝑛1 Σ𝑥𝑖 = 𝑥̅

μ
̂ = 𝑥̅
EE517-1453-INFERENCIA ESTADÍSTICA

1
E(X2) = 𝑛 Σ𝑥𝑖 2
1
𝜎 2 + μ2 = 𝑛 Σ𝑥𝑖 2
1
𝜎 2 =𝑛 Σ𝑥𝑖 2 - μ2
1
̅2
𝜎 2 = 𝑛 Σ𝑥𝑖 2 - 𝑥
1
̅2]
𝜎 2 = 𝑛 [ 𝛴𝑥𝑖 2 − 𝑛𝑥
1
̅ 2 − 𝑛𝑥
𝜎 2 = 𝑛 [ 𝛴𝑥𝑖 2 + 𝑛𝑥 ̅ 2 − 𝑛𝑥
̅2]
1
̅ 2 + 𝑛𝑥
𝜎 2 = 𝑛 [ 𝛴𝑥𝑖 2 − 2𝑛𝑥 ̅ 2]
1
𝜎 2 = 𝑛 [ 𝛴𝑥𝑖 2 − 2𝑥
̅ ̅2]
𝑥𝑖 + 𝑥
1
𝜎2 = 𝑛 [𝑥𝑖 2 − 2𝑥 ̅ 2]
̅ 𝑥𝑖 + 𝑥
1
𝜎 2 = 𝑛( )

𝜎̂ 2 = S2
El estimador por el método de Momentos de la media poblacional es la
media muestral y el estimador por el método de momentos de la Varianza
poblacional es la Varianza Muestral

2) Sea 𝑥1 , 𝑥2 , 𝑥3 ,.. 𝑥𝑛 una m.a. extraída de una población cuya función


de densidad es 𝑓(𝑥, 𝜃) = 𝜃𝑒 −𝜃𝑥 x>0 𝜃>0 Hallar un estimador del
parámetro 𝜃 por el método de momentos.
+∞ 1 𝑇
E(x) = ∫0 𝑥 𝜃𝑒 −𝜃𝑥 𝑑𝑥 = lim [−𝑥𝑒 −𝜃𝑥 − 𝜃2 𝑒 −𝜃𝑥 ]
𝑡→∞ 0
1
=
𝜃

Luego 𝑀10 = 𝑥̅
1
Igualando 𝑥̅ = E(x) =
𝜃
1
= 𝑥̅
𝜃
1
𝜃̂ = 𝑥̅

3) Sea 𝑥1 , 𝑥2 , 𝑥3 ,.. 𝑥𝑛 los valores de una m.a. de tamaño n tomada de


una población que tiene la densidad

2(𝜃−𝑥)
𝑓(𝑥, 𝜃)= 0<x< 𝜃
𝜃2

0 otro caso
EE517-1453-INFERENCIA ESTADÍSTICA

Determinar estimador de 𝜃 por el método de momentos

𝑀10 = 𝑥̅
𝜃 2𝑥(𝜃−𝑥) 𝜃
E(x) = ∫0 dx = 3
𝜃2

Igualando los momentos


𝜃
𝑥̅ =
3

Por tanto: 𝜃̂ = 3𝑥̅

EJERCICIOS

1) Dado una m.a. de tamaño “n” para una población uniforme en el intervalo
[−𝛼, 𝛼]. Determinar por el método de momentos el estimador de α
2) Sea la V.A. cuya función de probabilidad es:

𝜃
x≥1
𝑥 𝜃+1
𝑓(𝑥) =
0 en otro caso

Dado una m.a. de tamaño n se pide determinar un estimador del parámetro θ


por el método de momentos

3) Una población está representada por una V.A. X cuya función de


distribución es

1
1 − ( )𝜃 x>1
𝑥
𝑓(𝑥) =
0 en otro caso

Donde θ es un parámetro real positivo. Sea una m.a. 𝑥1 , 𝑥2 , 𝑥3 ,…. 𝑥𝑛


perteneciente a dicha población.

a) Encontrar un estimador del parámetro θ usando para ello el M.M.V.


b) Usando el método de momentos.

METODO DE MINIMOS CUADRADOS

Este método halla estimadores minimizando el error cuadrático medio.

En regresión

Y = α + BX + ε Modelo

𝑌̂ = α ̂X
̂+B
EE517-1453-INFERENCIA ESTADÍSTICA

α ̂ se hallan mediante mínimos cuadrados por el método de mínimos


̂ y B
cuadrados minimizando.

Σ 𝜀𝑖 2 = Σ( 𝑦𝑖 − 𝑦̂𝑖 )2
̂𝑥̂𝑖 ) 2
= Σ( 𝑦𝑖 − 𝛼 − B
̂ yα
Se deriva con respecto a B ̂ y se iguala a cero.
̂𝑥̂𝑖 )(- 𝑥𝑖 )=0
Σ2(𝑦𝑖 − 𝛼 − B
̂𝑥𝑖 2 )=0
−2 Σ(𝑥𝑖 𝑦𝑖 − 𝛼̂𝑥𝑖−B
̂Σ𝑥̂𝑖 2 =0
Σ𝑥𝑖 𝑦𝑖 - 𝛼̂ Σ𝑥𝑖 − B
̂Σ𝑥𝑖 2
Σ𝑥𝑖 𝑦𝑖 = 𝛼̂ Σ𝑥𝑖 + B Ecuación Normal

Derivando con respecto a 𝛼̂


̂𝑥𝑖 )(-1) = 0
2 Σ(𝑦𝑖 − 𝛼̂ − B
̂𝑥𝑖 )=0
(-2) Σ(𝑦𝑖 − 𝛼̂ − B
̂Σ𝑥𝑖 =0
Σ𝑦𝑖 − Σ𝛼̂ − B
̂Σ𝑥𝑖
Σ𝑦𝑖 = Σ𝛼̂ + B Ecuación Normal

̂ = n Σ𝑥𝑖𝑦𝑖 −2 (Σ𝑥𝑖) (Σ𝑦


B 2
𝑖)
𝑚Σ𝑥𝑖 −(Σ𝑥𝑖 )

̂𝑥̅
𝛼̂ = 𝑦̅ - B

EJERCICIO
1) Dado y=𝛼0 + 𝛼1 𝑥1 + 𝛼2 𝑥2 + ε Modelo
Estimar los parámetros (𝛼 ̂,
0 𝛼
̂,
1 𝛼
̂),
2 por el método de mínimos
cuadrados

TRABAJO PRACTICO

I) Obtener Estimadores por el Método de Máxima Verosimilitud


seleccionando 5 distribuciones.
II) Obtener Estimadores por el Método de Momentos seleccionando
5 distribuciones
EE517-1453-INFERENCIA ESTADÍSTICA

INTERVALO DE CONFIANZA

Cuando se obtiene el valor de un parámetro 𝜃 por medio de un intervalo cerrado


[𝐿1 , 𝐿2 ], llamado intervalo de confianza con una probabilidad dada (1-α), llamada nivel de
confianza en base a una m.a. y la correspondiente estadística 𝜃̂ esto es:

P[𝐿1 ≤ 𝜃 ≤ 𝐿2 ] = 1 - α ̂)
𝑓(𝜃

1−𝛼

𝐿1 𝐿2

La longitud del Intervalo de Confianza [𝐿1 , 𝐿2 ], es dado 𝐿2 −𝐿1

La precisión de un estimador insesgado se mide con el error estándar del estimador esto es
cuando menor es el error estándar del 𝜃̂ mayor es la precisión del estimador.

CANTIDAD PIVOTAL
Sea 𝑥1 , 𝑥2 , 𝑥3 ,……... 𝑥𝑛 una m.a. extraída de una población con función de densidad
𝑓(𝑥, 𝜃) y sea:
Q= q (𝑥1 , 𝑥2 , 𝑥3 ,……... 𝑥𝑛 ; 𝜃) una función de 𝑥1 , 𝑥2 , 𝑥3 ,……, 𝑥𝑛 y 𝜃
Si la distribución de 𝜃 𝒏𝒐 𝒅𝒆𝒑𝒆𝒏𝒅𝒆 𝒅𝒆 𝜽 entonces es definido como cantidad Pivotal.
EJEMPLOS

Sea 𝑥1 , 𝑥2 , 𝑥3 ,……... 𝑥𝑛 una m.a. extraída de una población N(μ,25)

a.) 𝑄1 = 𝑥̅ – μ → E(𝑄1 )= E(𝑥̅ – μ)

= E(𝑥̅ ) - E(μ)
=μ–μ =0

E(𝑄1 )= 0
V(𝑄1 )= (𝑥̅ – μ)

V(𝑄1 )=V (𝑥̅ ) + 0


𝜎2 25
V(𝑄1 )= =
𝑛 𝑛
25
𝑥̅ – μ ~ N (0, )
𝑛
EE517-1453-INFERENCIA ESTADÍSTICA

Por lo tanto 𝑄1 es una cantidad Pivotal porque no depende de μ


𝑥̅ – μ
b.) 𝑄2 = 𝜎
√𝑛

𝑥̅ – μ μ–μ
𝐸(𝑄2 ) = E( 𝜎 )= 𝜎 )=0
√𝑛 √𝑛

𝑥̅ – μ 1 𝜎2
𝑉(𝑄2 ) = V( 𝜎 )= 𝜎2
[ + 0]
𝑛
√𝑛 𝑛

𝜎2
𝑛
= 𝜎2
=1
𝑛

𝑄2 ~ N (0,1 )
Por lo tanto 𝑄2 es una cantidad Pivotal porque no depende de μ

c.) 𝑄3 =
μ

x̅ E(x̅) μ
E(Q 3 ) = E( ) = ) = =1
μ E(μ) μ

x̅ 1 1 𝜎2
V(Q 3 ) = V( ) = V(x̅) = .
μ μ2 μ2 𝑛

1 25
= .
μ2 𝑛

25
V(Q 3 ) =
μ2 𝑛

Por lo tanto 𝑄3 no es una cantidad Pivotal porque depende de μ


METODO DE LA CANTIDAD PIVOTAL PARA LA CONSTRUCCION DEL I.C.

Sea Q=q (𝑥1 , 𝑥2 , 𝑥3 ,……... 𝑥𝑛 ; 𝜃) una cantidad pivotal con densidad 𝑓(Q)

𝑓(𝑄)

1−𝛼
𝑄
𝑞1 𝑞2

P (𝑞1 <𝑄 < 𝑞2 ) =1 − 𝛼

P (𝑞1 <q (𝑥1 , 𝑥2 , 𝑥3 , … … . . . 𝑥𝑛 ; 𝜃) < 𝑞2 ) =1 − 𝛼

Utilizando operaciones aritméticas simples resulta P (𝑇1<𝜃 < 𝑇2 ) =1 − 𝛼


EE517-1453-INFERENCIA ESTADÍSTICA

INTERVALO DE CONFIANZA PARA LA MEDIA

Sea 𝑥1 , 𝑥2 , 𝑥3 , … … . . . 𝑥𝑛 una m.a. extraída de una población N(μ,𝜎 2 ).


CASO 1 (𝜎 2 conocida)

𝑥̅ – μ
Q= 𝜎 ~ N (0,1)
√𝑛

𝑓(𝑄)~N (0,1)

1−𝛼

−𝑍𝛼 0 𝑍𝛼=𝑍1−𝛼
2 2 2

P(−𝑍𝛼<Q<𝑍𝛼) = 1 − 𝛼
2 2

𝑥̅ – μ
P(−𝑍𝛼< 𝜎 <𝑍𝛼) = 1 − 𝛼
2 2
√𝑛

𝜎 𝜎
P(−𝑍𝛼 . 𝑛<𝑥̅ – μ<𝑍𝛼 ) =1−𝛼
2 √ 2 √𝑛

𝜎 𝜎
P(−𝑥̅ −𝑍𝛼 . < – μ<−𝑥̅ + 𝑍𝛼 )=1−𝛼
2 √𝑛 2 √𝑛
𝜎 𝜎
P(𝑥̅ −𝑍𝛼 . < μ<𝑥̅ + 𝑍𝛼 )=1−𝛼
2 √𝑛 2 √𝑛

𝑇1 𝑇2

𝜎
μ ∈ <𝑥̅ ± 𝑍𝛼 . 𝑛> con un nivel de confianza (1 − 𝛼 )
2 √

CASO 2 (𝜎 2 desconocida) y n≥30


El I.C. para μ al nivel de confianza (1 − 𝛼 )
𝑆
μ ∈ <𝑥̅ ± 𝑍𝛼 . 𝑛>
2 √

CASO 3 (𝜎 2 desconocida) y n≤30


𝑥̅ – μ
Q= 𝑆 ~ 𝑇(𝑛−1)
√𝑛
𝑓(𝑄)~ 𝑇(𝑛−1)

1−𝛼

−𝑇𝛼 0 𝑇𝛼
2 2
EE517-1453-INFERENCIA ESTADÍSTICA

𝑥̅ – μ
P(−𝑇𝛼< 𝑆 <𝑇𝛼) = 1 − 𝛼
2 2
√𝑛

𝑆 𝑆
P(𝑥
̅ − 𝑇𝛼 < μ<𝑥̅ + 𝑇𝛼 )=1−𝛼
2 √𝑛 2 √𝑛

𝑆
El I.C. para μ con un nivel de confianza <𝑥̅ ± 𝑇𝛼 . >
2 √𝑛

TAREA
Obtener los I.C. para μ cuando la población es finita
SOLUCION
𝑁−𝑛
Cuando el muestreo es sin reemplazo en poblaciones FINITAS se usa el factor de corrección
𝑁−1
entonces:

𝜎 𝑁−𝑛 𝜎 𝑁−𝑛
<𝑥
̅ − 𝑍𝛼 √ , 𝑥̅ + 𝑍𝛼 √ > Si se desconoce 𝜎 y n >30 se puede usar la
2 √𝑛 𝑁−1 2 √𝑛 𝑁−1
desviación estándar muestral (S)

𝑆 𝑁−𝑛 𝑆 𝑁−𝑛
<𝑥
̅ − 𝑍𝛼 √ , 𝑥̅ + 𝑍𝛼 √ >
2 √𝑛 𝑁−1 2 √𝑛 𝑁−1

NOTA

Si la V.A.X ~ N (μ,𝜎 2 ) conocido entonces el teorema se puede aplicar n<30 Longitud


del Intervalo de confianza.

CASO I
𝜎
L= 2𝑍𝛼
2 √𝑛

CASO II Como el tamaño de muestra aparece en el


denominador entonces muestras grandes darán
𝑆
L= 2𝑍𝛼 I.C. de longitud mas corta por lo tanto mas
2 √𝑛
preciso
CASO III
𝑆
L= 2𝑇𝛼
2 √𝑛

Tamaño de muestra (n) conocida la longitud del I.C.


4𝑍 𝛼 2 𝜎 2
2
CASO I n= 𝐿2

ERROR DE ESTIMACION (E)

E = |𝜃̂ − 𝜃|

Para la media |𝑥
̅ − 𝜇|
𝐸

𝐿1 𝑥̅ 𝜇 𝐿2
EE517-1453-INFERENCIA ESTADÍSTICA

El valor mínimo de error de Estimación es 0, el valor máximo del error de la estimación


𝜎 𝜎
E =|𝑥
̅ − 𝜇 | ≤ 𝑍𝛼 𝐸𝑂 = 𝑍𝛼 Es el error máximo de estimación
2 √𝑛 2 √𝑛

De donde
𝑍𝛼 2 .𝜎2 𝑍𝛼 2.𝜎2 𝑁
2 2
𝑛= 𝑛=
𝐸2 𝑍𝛼 2 .𝜎2 +𝐸 2(𝑁−1)
2

𝑍𝛼 𝜎
2 𝜎 𝑁−𝑛
Error de Estimación no sea mayor que un valor dado E donde E≥ E= 𝑍𝛼 √
√𝑛 2 √𝑛 𝑁−1

EJEMPLOS

1) Una m.a. de 400 pequeños comerciantes indicó que la media de los ingresos mensuales
era 800 u.m. Estime la media de lo población que consiste de los ingresos de todos los
pequeños comerciantes mediante un I.C. del 95% asuma que la desviación estándar de
esa población es 200 U.M.

X: V.A. Ingresos mensual de todos los pequeños comerciantes

Solución
𝑥̅ = 800
1 − 𝛼 = 0.95
𝛼 = 0.05
−𝑍𝛼 𝑍𝛼
2 2

𝛼
P (Z≤𝑍0 )= 1 -
2

0.05
=1-
2

= 0.975
𝑍0 = 1.96
𝜎
μ ∈ <𝑥̅ ± 𝑍𝛼 . 𝑛>
2 √

𝜎 𝜎
𝑥̅ − 𝑍𝛼 . 𝑥̅ + 𝑍𝛼 .
2 √𝑛 2 √𝑛

200 200
800-1.96 800+1.96
√400 √400

800-19.6 = 780.4 800+19.6 = 819.6

Por lo tanto [780.4 ≤ 𝜇 ≤ 819.6]


EE517-1453-INFERENCIA ESTADÍSTICA

2) Un analista de investigación de mercados escogió una m.a. de 100 clientes de una


población de 500 clientes de una gran tienda que declaran ingresos mayores a 800u.m.
Se encontró que los clientes de la muestra que estaban en la tienda un promedio de
1000 por año. Si con este valor de la muestra estimó que el gasto, promedio por año de
esta población finita varia de 940 a 1060 que nivel de confianza utilizó. Suponga que la
desviación estándar de tal población es 300.
Solución

n=100
N= 500 P (940 ≤ 𝜇 ≤ 1060)= 1 - α

𝜎 𝑁−𝑛
𝑥̅ = 1000 1060 = 𝑥̅ + 𝑍1−𝛼 √
2 √𝑛 𝑁−1

300 400
σ = 300 1060 = 1000 + 𝑍1−𝛼 √
2 10 499

60 =𝑍1−𝛼 (26.859687)
2

60
𝑍1−𝛼 = = 2.2338309
2 26.859687

𝑍1−𝛼≅ 2.23
2

Viendo la tabla
𝛼
1 - = 0.98713
2
𝛼
= 0.01287
2

𝛼 = 0.02574

Por lo tanto, el nivel de la confianza 1- 𝛼 = 0.97426 ≅ 97.43%

3) Construir un I.C. del 98% de confianza para la media de la población. A partir de una
muestra de tamaño 64 extraída de una población con σ= 10, la media muestral resultó
𝑥̅ = 48.5

1 – α = 0.98
1-α
α = 0.02
α
= 0.01
2
α
−𝑍0 𝑍0 P(𝑍 ≤𝑍0) = 1 - = 1 – 0.01 = 0.99
2
P(𝑍 ≤𝑍0) = 0.99

𝑍0 = 2.326 ≈ 2.33
𝜎 (2.326)(10)
𝑥̅ - 𝑍0 = 48.5 -
√𝑛 8
𝜎
= 48.5 – 2.9075 𝑥̅ + 𝑍0
√𝑛
(2.326)(10)
= 45.5925 48.5 + 8
= 48.5 + 2.9075 = 51.4075
Por tanto, μ ∈ <45.5925,51.4075> con N.C. del 98%.
EE517-1453-INFERENCIA ESTADÍSTICA

4) Al tomar una m.a. de 50 focos se registró la vida útil de C/U de ellos en una tabla de
frecuencias con 6 intervalos.
𝑋𝑚𝑖𝑛 = 400 𝑋𝑚á𝑥 =2200
Además 𝑓1 =12 𝐹2 =12 ℎ3 =0.18 𝐹4 =46 𝑓6 =1

Construir un I.C. del 99% para la media poblacional

5) Un investigador quiere determinar el tiempo promedio que un mecánico tarda en


cambiar las llantas de un auto, y además desea asegurar con una confianza del 98% que
el error de su muestra sea a lo sumo de 0.5 min se sabe por experiencia que σ=1.6min,
¿qué tamaño debe tener la muestra?
EE517-1453-INFERENCIA ESTADÍSTICA

SEMANA 9
EE517-1453-INFERENCIA ESTADÍSTICA

INTERVALOS DE CONFIANZA PARA LA VARIANZA

Sea 𝑥1 , 𝑥2 , 𝑥3 , … … . . . 𝑥𝑛 una m.a. extraída de una población N(μ, 𝜎 2 ).

(𝑛−1)𝑠 2 2
Q= ~ 𝑋(𝑛−1)
𝜎2

2
𝑓(𝑄)~ 𝑋𝑛−1

P(𝑋𝛼2 <Q<𝑋1−
2
𝛼) = 1 − 𝛼
2 2

(𝑛−1)𝑠2
P(𝑋𝛼2 < 𝜎2
2
<𝑋1− 𝛼) ) = 1 − 𝛼
2 2

1 𝜎2 1
P( < < )=1−𝛼
𝑋2 𝛼 (𝑛−1)𝑠2 𝑋2𝛼
1− 2 2

(𝑛−1)𝑠2 (𝑛−1)𝑠2
P( 2 <𝜎 2 < )=1−𝛼
𝑋 𝛼 𝑋2𝛼
1− 2 2

INTERVALOS DE CONFIANZA PARA LA RAZON DE VARIANZAS

Sea 𝑥1 , 𝑥2 , 𝑥3 , … … . . . 𝑥𝑛1 , una m.a. extraída de una población N (𝜇1 , 𝜎12 ), y


𝑦1 , 𝑦2 , 𝑦3 , … … . . . 𝑦𝑛2 , una m.a. extraída de una población N (𝜇2 , 𝜎22 ), ambas
𝜎2
poblaciones Independientes I.C. para 𝜎12 cantidad pivotal
2
𝑠2
1
𝜎2
1
Q= 𝑠2
~ 𝐹(𝑛1 −1,𝑛2 −1)
2
𝜎2
2

𝑓(𝑄)

𝐹𝛼 𝐹1−𝛼
2 2
EE517-1453-INFERENCIA ESTADÍSTICA

P(𝐹𝛼 <Q<𝐹1−𝛼) = 1 − 𝛼
2 2

𝑠2
1
𝜎2
1
P(𝐹 𝛼< 2
𝑠2
<𝐹1−𝛼) ) = 1 − 𝛼
2 2
𝜎2
2

𝑠 2 𝜎2
P(𝐹𝛼 <𝑠12 𝜎22<𝐹1−𝛼) = 1 − 𝛼
2 2 1 2

1 𝜎12 𝑠22 1
P(𝐹 < < )= 1 − 𝛼
𝛼 𝜎22 𝑠12 𝐹𝛼
1−
2 2

𝑠12 1 𝜎2 1 𝑠12
P( < 12 < )= 1 − 𝛼
𝑠22 𝐹 𝛼 𝜎2 𝐹𝛼 𝑠22
1−
2 2

𝜎2
I.C. para 𝜎12 al nivel (1 −𝛼)
2

𝑠12 2
< . 𝐹 1 𝛼, 𝑠𝑠12 𝐹1𝛼>
𝑠22
1− 2
2 2

Ejemplos
1) Los siguientes datos representan los tiempos de duración de las películas que
producen dos compañías cinematográficas.
Compañía Tiempo en minutos
I 103, 94, 110, 87, 98
II 118,97,82,123,92,175,88
Construya un I.C. al 90% para la razón de varianzas
¿Se puede afirmar que la variabilidad de las duraciones de las películas son iguales?
SOLUCION

𝑠12 = 76.3 𝑛1 =5
0.05
𝑠22 = 1035.90 𝑛2 =7 0.05
0.90

𝐹0,05,4,6 𝐹0,05,4,6

76.3 1 76.3 1
<1035(90) . 4,53, 1035(90) . 0.162>

𝜎12
∈ <0.0126,0.45167> Al N.C. del 90%
𝜎22

Podemos afirmar que la variabilidad de la razón de varianzas son iguales.


EE517-1453-INFERENCIA ESTADÍSTICA

2) Supongamos que una m.a. de tamaño 10 dio S2= 2.25


¿Cuáles son los limites de confianza al 80% para la verdadera varianza?
3) Sea X una variable V.A. tal que X ~N (μ, 𝜎 2 ). Donde μ, 𝜎 2 son desconocidos. Una muestra
de tamaño 15 dio los valores ∑15 15 2
𝑖=1 𝑥𝑖 = 8.7 , ∑𝑖=1 𝑥𝑖 =27.3

Determine el Intervalo de Confianza del 95% para 𝜎 2

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS


Sea 𝑥1 , 𝑥2 , 𝑥3 , … … . . . 𝑥𝑛1 , una m.a. extraída de una población N (𝜇1 , 𝜎12 ), y
𝑦1 , 𝑦2 , 𝑦3 , … … . . . 𝑦𝑛2 , una m.a. extraída de una población N (𝜇2 , 𝜎22 ), Ambas
poblaciones independientes.
CASO 1 Varianzas Conocidas
̅̅̅
𝑥1̅−𝑥
̅̅̅2̅−(𝜇1 −𝜇2 )
Sea Q= ~ N(0,1)
𝜎 2 𝜎2
√ 1+ 2
𝑛 1 𝑛2

I.C. para 𝜇1 − 𝜇2 al nivel (1 – α)


P(-𝑍𝛼 < 𝑄 < 𝑍𝛼 )= 1 – α
2 2

̅̅̅
𝑥1̅−𝑥
̅̅̅2̅−(𝜇1 −𝜇2 )
P(-𝑍𝛼 < < 𝑍𝛼 )= 1 – α
2 𝜎2 𝜎2 2
√ 1+ 2
𝑛1 𝑛2

Resultando

𝜎2 𝜎2
𝑥2 ± 𝑍𝛼 √𝑛1 + 𝑛2 >
̅̅̅1 − ̅̅̅
<𝑥
2 1 2

CASO 2 Varianzas Desconocidas 𝒏𝟏 +𝒏𝟐 ≥30


̅̅̅
𝑥1̅−𝑥
̅̅̅2̅−(𝜇1 −𝜇2 )
Q= ~ N(0,1)
𝑠2 𝑠2
√ 1+ 2
𝑛 1 𝑛2

I.C. para 𝜇1 − 𝜇2 al N.C. (1-α)


̅̅̅
𝑥1̅−𝑥
̅̅̅2̅−(𝜇1 −𝜇2 )
P(-𝑍𝛼 < < 𝑍𝛼 ) = 1- α
2 𝑠2 𝑠2 2
√ 1+ 2
𝑛1 𝑛2

Resultando

𝑠12 𝑠22
<𝑥 𝑥2 ± 𝑍𝛼 √
̅̅̅1 − ̅̅̅ + >
2 𝑛1 𝑛2
EE517-1453-INFERENCIA ESTADÍSTICA

CASO 3 Varianzas Desconocidas 𝜎12 =𝜎22 𝑦 𝑛1 +𝑛2 ≤30

̅̅̅
𝑥1̅−𝑥
̅̅̅2̅−(𝜇1 −𝜇2)
Sea Q= 1 1
~ 𝑇 (𝑛1 +𝑛2 −2)
√𝑆𝑃2 (𝑛 +𝑛 )
1 2

I.C. para 𝜇1 − 𝜇2

̅̅̅
𝑥1̅−𝑥
̅̅̅2̅−(𝜇1 −𝜇2)
P(-𝑇𝛼 < 1 1
<𝑇𝛼 )= 1 - α
2 √𝑆𝑃2 (𝑛 +𝑛 ) 2
1 2

1 1
𝑥2 ± 𝑇𝛼 √𝑆𝑃2 (𝑛 + 𝑛 )>
̅̅̅1 − ̅̅̅
<𝑥
2 1 2

Donde:
(𝑛1 −1)𝑆12+(𝑛2−1)𝑆22
𝑆𝑃2 =
𝑛1 +𝑛2−2

CASO 4 Varianzas Desconocidas 𝜎12 ≠ 𝜎22 𝑦 𝑛1 +𝑛2 ≤30


̅̅̅
𝑥1̅−𝑥
̅̅̅2̅−(𝜇1 −𝜇2 )
Sea Q = ~ 𝑇(𝑔)
𝑆2 𝑆 2
√( 1 + 2 )
𝑛1 𝑛2

𝑆2 𝑆 2
( 1 + 2 )2
𝑛1 𝑛 2
Donde 𝑔= 𝑆2 𝑆2
-2
( )2 ( 2 )2
1
𝑛1 𝑛2
( + )
𝑛1 +1 𝑛2 +1

𝑆2 𝑆2
𝑥2 ± 𝑇𝛼,𝑔 √𝑛1 + 𝑛2 )>
̅̅̅1 − ̅̅̅
I.C. es <𝑥
2 1 2

EJEMPLOS
Una m.a. de tamaño 36 es seleccionada de una población N (𝜇1 ,9), donde 𝑥̅1 = 70,
otra muestra de tamaño 25 es seleccionada de otra población N (𝜇2 , 16), donde
𝑥̅2 =60, construir un intervalo de confianza para 𝜇1 − 𝜇2 con 96% de confianza:
SOLUCION
𝑛1 = 36 𝑛2 = 25
𝑥̅1 = 70 𝑥̅2 =60

𝜎12 =9 𝜎22 =16


1 – α = 0.96
α = 1- 0.96 = 0.04
EE517-1453-INFERENCIA ESTADÍSTICA

𝛼
= 0.02
2

P(Z≤𝑍1−𝛼) = 0.98
2

Por lo tanto 𝑍1−𝛼 = 2.054


2

−𝑍1−𝛼 𝑍1−𝛼
2 2

𝜎2 1 𝜎2
2
̅̅̅1 − ̅̅̅
<𝑥 𝑥2 ± 𝑍1−𝛼 ,𝜎̅̅̅ ̅̅̅2̅ >
𝑥1̅−𝑥 𝜎̅̅̅ ̅̅̅2̅ =√𝑛 + 𝑛
𝑥1̅−𝑥
2 1 2

9 16
70 – 60 ± (2.054) (0.9434) = √36 + 25

10 -1.9377 = 8.06226 = 0.9434


10 + 1.9377 = 11.93774
Por lo tanto 𝜇1 − 𝜇2 ∈ <8.06226 ,11.93774>
Al N.C. del 96%
EJERCICIOS
1) El agente de compras de una compañía considera adquirir una de dos marcas
de neumáticos como prueba, compra 8 llantas de cada marca y las pone a
trabajar regularmente. El registro de duración de cada tipo de llanta
Proporcionó las estadísticas siguientes:
̅̅̅
𝑥𝐴 = 250𝑘𝑚 ̅̅̅=280km
𝑥𝐵
𝑆𝐴 = 40km 𝑆𝐵 = 30km
a) Construya el Intervalo de confianza para la diferencia de medias
asumiendo un riesgo de 5%

2) Dos universidades nacionales de lima Metropolitana tienen métodos


distintos para inscribir a sus postulantes para el examen de admisión.
Los dos desean comparar el tiempo promedio que les toma a los estudiantes
completar el trámite de inscripción. En cada universidad se anotaron los
tiempos de inscripción para 100 alumnos seleccionados al azar las medias y
las desviaciones estándares muestrales son las siguientes:

𝑥1 = 50.1
̅̅̅ 𝑥2
̅̅̅=52.9
𝑆1 = 4.8 𝑆2 = 5.4
EE517-1453-INFERENCIA ESTADÍSTICA

Si se supone que el muestreo se llevó a cabo sobre dos poblaciones


distribuidas normalmente e independientes, obtener los I.C. del 90, 95 y 99%
para la diferencia entre las medias del tiempo de inscripción para las dos
universidades con base a esta evidencia ¿Se estaría inclinando a concluir que
existe una diferencia real entre los tiempos medios para cada universidad?
EE517-1453-INFERENCIA ESTADÍSTICA

SEMANA 10
EE517-1453-INFERENCIA ESTADÍSTICA

INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN


Sea 𝑦1, 𝑦2 , 𝑦3 ,…. 𝑦𝑛 , una m.a. extraída de una población B(1,π)
𝑃̅ −π
Q= ~ 𝑁(0,1)
π(1−π)

𝑛

I.C. para π
P(−𝑧𝛼 <Q<𝑧𝛼 ) = 1 − 𝛼
2 2

𝑃̅−π
P(−𝑧𝛼 < < 𝑧𝛼 ) ) = 1 − 𝛼
2 π(1−π) 2

𝑛

π(1−π) π(1−π)
P(𝑃̅−𝑧𝛼 √ 𝑛 <π<𝑃̅ +𝑧𝛼 √ 𝑛 ) = 1 − 𝛼
2 2

𝑃(1−𝑃) ̅ ̅
I.C. para π <𝑃̅±𝑧𝛼 √ >
2 𝑛

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES


𝑃̅1 −𝑃̅2 −(𝜋1 −𝜋2)
Sea Q = 𝜋 (1−𝜋 ) 𝜋 (1−𝜋 )
~ 𝑁(0,1)
√ 1𝑛 1+ 2𝑛 2
1 2

I.C.

P (−𝑧𝛼 < Q < 𝑧𝛼 ) = 1 − 𝛼


2 2

𝑃̅1 −𝑃̅2−(𝜋1 −𝜋2)


P (−𝑧𝛼 < 𝜋 (1−𝜋 ) 𝜋 (1−𝜋 )
< 𝑧𝛼 ) = 1 − 𝛼
2 √ 1𝑛 1+ 2𝑛 2 2
1 2

I.C. para 𝜋1 − 𝜋2
̅ ( ̅ ) ̅ ( ̅ )
< 𝑃̅1 − 𝑃̅2 ± 𝑧𝛼 √𝑃1 1−𝑃 𝑃2 1−𝑃2
𝑛
1
+ 𝑛
> al N.C. de 1 - α
2 1 2

Longitud del Intervalo

̅( ̅)
ℒ = 2 𝑧𝛼 √𝑃 1−𝑃
𝑛 2

Tamaño de muestra
4𝑧𝛼 2 𝑃̅ (1−𝑃̅ )
2
n= ℒ2

Error Máximo
EE517-1453-INFERENCIA ESTADÍSTICA

𝑃̅ (1−𝑃̅)
𝐸0 = 𝑧𝛼 √
2 𝑛

Tamaño de muestra en términos de 𝐸0 :


̅ (1−𝑃̅ )
𝑃
n= 𝑧𝛼 2
2 𝐸0 2

Cuando 𝑃̅ =0.5, n alcanzará su valor máximo para el caso de Población Finita (N).

̅( ̅)
< 𝑃̅ ± 𝑧𝛼 √𝑃 1−𝑃 𝑁−𝑛
𝑛

𝑁−1
>
2

EJEMPLOS
1) En una determinada población se toma una muestra al azar de 256 personas.
De esta muestra el 20% de las personas llevan gafas graduadas y el resto no.
Calcular I.C. aproximadamente para la proporción poblacional de las personas
que llevan gafas graduales a un nivel de confianza del 95%.
n=256

( )
< 0.2 ± 1.96√0.2 256
1−0.2
𝑃̅=0.20 >

1 − 𝛼 = 0.95 < 0.2 ± 0,049>


𝑧𝛼 = 1.96 < 0.151, 0.249>
2

2) Suponga que quiere estimarse el porcentaje de analfabetismo en cierto país. Se


desea estimarlo con un margen de error menos del 4% con una probabilidad de
0.98.
¿De qué tamaño debe tomarse la muestra, si nunca se ha realizado una
investigación al respecto?
𝐸0 =4%
1 − 𝛼 = 0.98
n= ¿?
̅ (1−𝑃̅ )
𝑃
1 − 𝛼 = 0.98 n= 𝑧𝛼 2
2 𝐸0 2

𝛼= 0.02 Como nunca se hace un estudio 𝑃̅ =0.50


𝛼 0.5(1−0.5)
= 0,01 n= (2.33)2
2 0.042

𝑧1−𝛼 =𝑧0.99= 2.33 n = 848.26 ≈848


2
EE517-1453-INFERENCIA ESTADÍSTICA

b) De que tamaño debe ser la muestra si en una encuesta previa se estima en 0.30 la
proporción de analfabetos.
0.3(0.7)
n= (2.33)2 = 712.54 ≈ 713
0.042

3) Una compañía Tabacalera afirma que sus cigarrillos marcan A se venden mas
que sus cigarrillos marca B
Si se encuentra que 45 de 200 fumadores prefieren los cigarrillos marca A y 21
de 150 fumadores prefieren B. Calcule I.C. al 97% para la diferencia entre las
proporciones de ventas de las dos marcas de cigarrillo.

45 21
𝑃̅𝐴 = 200 = 0.225 𝑃̅𝐵 = 150 = 0.14

1 − 𝛼 = 0.97
𝛼 = 0.03
45 45 21 21
𝛼 (1− ) (1− )
= 0,015 (𝑃̅𝐴-𝑃̅𝐵 ± 2.17√200 200200 + 150 150150 )
2

𝛼 0.225(0.775) 0.14(0.86)
1 − 2 = 0.985 (0.225-0.14 ± 2.17√ + )
200 150

<-0,0038,0.1738> Al N.C. 97%


1−𝛼

𝑧1−𝛼
2

P(𝑍 ≤ 𝑧0.985)=2.17
EE517-1453-INFERENCIA ESTADÍSTICA

10
EE517-1453-INFERENCIA ESTADÍSTICA

EJERCICIOS

I) De 50 000 válvulas fabricadas por una compañía, se retira una muestra


aleatoria de 400 válvulas y se obtiene una vida media de 800 horas y una
desviación estándar de 100 horas.
a) ¿Cuál es el Intervalo de Confianza de 99% para la media poblacional?
b) Con que coeficiente de confianza se diría que la vida media está en
<799.11 800.98>
c) ¿Qué tamaño debe tener la muestra para que el intervalo de la media
<792?16 807.84> Sea de 95% de confianza.
II) Un Saco de patatas fue muestreado para analizar su calidad con tal fin se
seleccionaron 16 patatas registrándose el peso de cada una de las cuales se
obtuvieron los siguientes resultados.

∑16 2
𝑖=1 𝑥𝑖 𝑛
= 249 (𝑛−1) 𝑥̅ 2 = 240
𝑛−1

Calcule

a) Un intervalo del 99% de confianza para la media poblacional


b) Un intervalo del 90% de confianza para la varianza poblacional
III) Un investigador está estudiando la resistencia de un determinado material bajo
determinadas condiciones. Él sabe que esa variable tiene distribución normal con
desviación estándar de 2 unidades
a) Utilizando los siguientes valores obtenidos de una muestra de tamaño 9,
determine el intervalo de confianza para la resistencia media con un coeficiente
de confianza de 90%.
4.9, 7.0, 8.1, 4.5, 5.6, 6.8, 7.2, 5.7, 6.2 unidades
b) ¿Cuál es el tamaño necesario de la muestra si quisiéramos que el error
cometido, al estimar la resistencia media, no sea superior a 0,1 unidades con
probabilidad de 0.90?
IV) En una fabrica al seleccionar una muestra de cierta pieza, se obtiene las siguientes
medidas para los diámetros.
10, 11, 11,11,12,12,12,12,13,13
13,13, 13,13, 13,13, 13,13, 13,13
14,14,14,14,14,15, 15,15,16, 16
a) Estimar la media y la Varianza.
b) Construir el intervalo de confianza para la media.
EE517-1453-INFERENCIA ESTADÍSTICA

EJERCICIOS

1) Una determinada comunidad esta compuesta de 1200 unidades habitacionales.


De una muestra elegida al azar de 200 unidades resultó que 50 necesitaban
reparaciones urgentes. Construir el intervalo de confianza del 90% para la
proporción real de las unidades que necesitan reparación.
2) Supongamos que estamos interesados en estimar el porcentaje de consumidores
de un cuarto producto. Si una muestra de tamaño 300 dio 100 individuos que
consumían dicho producto. Determine:
a) El I.C. para π, con coeficiente de confianza del 95%
b) El tamaño de la muestra para que el error de estimación no exceda a 0.02
unidades con probabilidad de 95%.
3) En una investigación de mercado para estudiar la preferencia de la población
de una ciudad en relación a un determinado producto, se selecciona una m.a.
de 300 individuos, de los cuales 180 prefieren ese producto.
a) Determine un intervalo de confianza para la proporción de la población que
prefieren el producto en estudio
b) Determine la probabilidad de que el estimador puntual de esa proporción
no difiera del verdadero valor en mas de 0.001
c) ¿Es posible obtener un estimador puntual de esa proporción que no difiera
del valor verdadero en más de 0.0005 con probabilidad de 0.95? Caso
contrario determine que es lo que debe hacerse.
4) Para determinar cuántas en un pueblo joven de 100 000 familias califican para
recibir canastas alimentarias del Ministerio de Agricultura. Se tomó una muestra
aleatoria de 360 familias. Se encontró que 98 de esas 360 familias calificaron.
Calcular los límites de confianza del 90% para el numero total de familias de ese
pueblo joven que califican para las canastas alimentarias.
5) De una m.a. de 150 universitarios, 105 dijeron que en alguna parte del universo
tenían que haber vida. De otra m.a. de 200 jóvenes de la misma edad pero que
no eran universitarios, 120 dijeron lo mismo. Construir un I.C. del 95% para
diferencia entre las dos proporciones poblacionales.
EE517-1453-INFERENCIA ESTADÍSTICA

SEMANA 11
EE517-1453-INFERENCIA ESTADÍSTICA

PRUEBA DE HIPÓTESIS O DOCIMA

INTRODUCCION
El objetivo de este tema es exponer los métodos estadísticos básicos que se aplican para
tomar decisiones sobre la conjetura que se hace acerca del valor numérico del
parámetro de una población en estudio y que es sometida a comprobación experimental
con el propósito de determinar si los resultados de una muestra aleatoria extraída de
esa población contradicen o no en forma significativa tal afirmación.

HIPOTESIS ESTADISTICA
Se denomina hipótesis estadística a cualquier afirmación o conjetura que se hace acerca
de la distribución de una o más poblaciones. La afirmación o conjetura se puede referirse
bien a la forma o tipo de distribución de probabilidad de la población o bien referirse
al valor o valores de uno o más parámetros de la distribución conocida su forma.

La hipótesis estadística, consiste en suponer que los parámetros, que define a la


población, toma determinados valores numéricos.
HIPÓTESIS NULA Y ALTERNATIVA
Se denomina hipótesis nula y se representa por 𝐻𝑜 a la hipótesis que es aceptada
provisionalmente como verdadera y cuya validez será sometida a comprobación
experimental toda hipótesis nula es acompañada de una hipótesis alterna que es lo
contrario de la hipótesis nula. La Hipótesis alterna se representa por 𝐻1

PRUEBA DE UNA HIPÓTESIS ESTADÍSTICA


La prueba de una Hipótesis estadística es un proceso que nos conduce a tomar la
decisión de aceptar o rechazar la Hipótesis nula, en contraposición a la alterna y en base
a los resultados de una muestra aleatoria seleccionada de la población en estudio.
TIPOS DE PRUEBAS DE HIPÓTESIS
El tipo de prueba depende básicamente de la Hipótesis alterna, se puede encontrar
pruebas de una cola donde la hipótesis alterna es unilateral y pruebas de dos colas
donde la alterna es bilateral.
REGIÓN RECHAZO
Es la región que contiene los valores para los cuales se rechaza la hipótesis nula

REGIÓN DE ACEPTACION
EE517-1453-INFERENCIA ESTADÍSTICA

Es la región que contiene los valores para los cuales no se rechaza la hipótesis nula.
DECISION
Si el valor del estadígrafo cae dentro de la región de rechazo entonces se rechaza la
hipótesis nula.
PROCEDIMIENTO PARA REALIZAR UNA PRUEBA DE HIPÓTESIS
El procedimiento que se recomienda utilizar para pruebas de hipótesis con
parámetro θ se resume en los siguientes pasos:
PASO 1
Formular la hipótesis nula 𝐻𝑜 y la Hipótesis alternativa 𝐻1 apropiada:

PRUEBA DE DOS COLAS PRUEBA DE UNA COLA


𝐻𝑜 : θ = θ𝑜 A LA DERECHA A LA IZQUIERDA
𝐻1 : θ ≠ θ𝑜
𝐻𝑜 : θ = θ𝑜 𝐻𝑜 : θ = θ𝑜
𝐻1 : θ > θ𝑜 𝐻1 : θ < θ𝑜

R.R -c R.A +c R.R REGION DE ACEPTACION


+c R.R R.R -c REGION DE ACEPTACION
R.A
R.A

PASO 2
Seleccionar α = nivel de significación generalmente 5% 1%
PASO 3
Establecer el estadígrafo apropiado a usar en la prueba y hallar el valor del estadígrafo
PASO 4
Establecer la región crítica y de aceptación para el estadígrafo. Recuerde que la región
critica debe ser construida en base al valor significante fijada.
PASO 5
Tomar la decisión de rechazar la hipótesis 𝐻0 si el valor del estadístico de Prueba está
en la región crítica. En caso contrario no se rechaza 𝐻0 .

PRUEBA DE HIPÓTESIS DE LA MEDIA


EE517-1453-INFERENCIA ESTADÍSTICA

PRUEBA DE DOS COLAS PRUEBA DE UNA COLA


𝐻𝑜 : μ = μ𝑜 A LA DERECHA A LA IZQUIERDA
𝐻1 : μ ≠ μ𝑜
𝐻𝑜 : μ = μ𝑜 𝐻𝑜 : μ = μ𝑜
𝐻1 : μ > μ𝑜 𝐻1 : μ < μ𝑜

R.R -c R.A +c R.R +c R.R


REGION DE ACEPTACION
R.R -c REGION DE ACEPTACION

R.A
R.A

Estadísticos de prueba
𝑥̅ −μ𝑜 𝑥̅ −μ𝑜
Z= 𝜎 ~N(0,1) Z= 𝑆 ~N(0,1)
√𝑛 √𝑛

𝑥̅ −𝜇
T= 𝑆 ~𝑇(𝑛−1)𝑔𝑙 n≤30
√𝑛

SE USA Z
1) Si la muestra es grande varianza poblacional conocida o desconocida y población
normal o no.
2) Muestra pequeña, varianza poblacional conocida y población normal.
SE USA T
Si la muestra es pequeña, varianza poblacional desconocida y población normal.
EJEMPLOS
1) En una muestra de 19 adolescentes que sirvieron de sujetos en un estudio
inmunológico una variable de interés fue el diámetro de reacción de la piel a una
prueba con un antígeno. La media muestral y la desviación estándar fue
respectivamente 21 y 11 mm de eritema ¿Puede concluir a partir de estos datos
que la media de la población es 30?
SOLUCION
𝐻𝑜 : μ = 30
𝐻1 : μ ≠ 30
α=0.05
Estadísticos de prueba
𝑥̅ −μ 21−30
T= 𝑆 ~𝑇(𝑛−1) → T= 11 = - 3.56637
√𝑛 √19

𝑅𝑅 𝑇 𝑇1−𝑅𝑅
𝛼
−2.101 =2.101
2
EE517-1453-INFERENCIA ESTADÍSTICA

𝑇1−𝛼,18 = 𝑇0.975,18 = 2.101


2

Por tanto, se debe rechazar 𝐻0 . Finalmente, con un riesgo del 5% se concluye que el
diámetro de reacción de la piel a una prueba es diferente a 30mm.

2) Una muestra de 35 estudiantes del 1er año tuvo una calificación media de 77 en
una prueba efectuada para medir su actitud. La desviación estándar de la
muestra fue de 10. ¿Proporcionan estos datos evidencia suficiente como para
indicar, a un nivel de significación 0,01 que la media de la población es menor
que 80?
Sea X: Puntaje obtenido en la prueba de actitud

𝐻𝑜 : μ = 80
𝐻1 : μ < 80
𝛼=0.01
n=35 𝑥̅ = 77 S=10

0.01
REGION DE ACEPTACION
= -2.32
𝑥̅ − μ
𝑍= ~𝑁(0,1)
𝑆
√𝑛
77−80 3
𝑍= 10 =- = -1.77482
1.69031
√35

DECISION

El valor -1.77482, se encuentra en la región de aceptación es decir se acepta 𝐻𝑜 . Finalmente,


con un riesgo del 1 % se concluye que el puntaje obtenido no es menor a 80.

EJERCICIOS

1) El promedio de nicotina que tienen los cigarros de cierta marca es igual a 11mg. Se sabe
que la distribución de la cantidad de nicotina es normal con desviación estándar igual a
0.5mg. El creador de un nuevo procedimiento de fabricación asegura que su
procedimiento disminuye el promedio de 11mg. Al nivel de significancia de 0.05 ¿Se
puede decir que el nuevo procedimiento disminuye el promedio de nicotina?
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA

PRUEBA DE HIPÓTESIS PARA LA VARIANZA

Sea 𝑥1 , 𝑥2 , 𝑥3 ,…… 𝑥𝑛 una m.a. de una población N(μ, 𝜎 2 ).

Casi 1
PRUEBA UNILATERAL HACIA LA DERECHA

𝐻0 : 𝜎 2 ≤𝜎02

𝐻1 : 𝜎 2 >𝜎02
𝑅𝐴 2
𝑋1−𝛼 𝑅𝑅

Nivel de significancia α

Estadístico de Contraste

(𝒏−𝟏)𝑺𝟐 2
~ 𝑋𝑛−1
𝝈𝟐

Valor del estadístico de Prueba

(𝒏−𝟏)𝑺𝟐
𝑋2= V = 𝜎02

Regla de Decisión

2
Si 𝑋 2 = V >𝑋1−𝛼 → Rechazar 𝐻0
2
Si 𝑋 2 = V ≤𝑋1−𝛼 → No Rechazar 𝐻0

Casi 2
PRUEBA UNILATERAL HACIA LA IZQUIERDA

𝐻0 : 𝜎 2 ≥𝜎02

𝐻1 : 𝜎 2 <𝜎02 𝛼
𝑅𝑅 𝑅𝐴
𝑋𝛼2
EE517-1453-INFERENCIA ESTADÍSTICA

Nivel de significancia α
Estadístico de Contraste

(𝒏−𝟏)𝑺𝟐 2
~ 𝑋𝑛−1
𝝈𝟐

Valor del estadístico de Prueba

(𝒏−𝟏)𝑺𝟐
𝑋2= V = 𝜎02

Regla de Decisión

Si 𝑋 2 = V <𝑋𝛼2 → Rechazar 𝐻0
Si V ≥𝑋𝛼2 → No Rechazar 𝐻0

Casi 3
PRUEBA BILATERAL

𝐻0 : 𝜎 2 =𝜎02
𝜶
𝐻1 : 𝜎 2 ≠𝜎02 𝟐 𝜶
𝟐
𝑅𝑅 2 𝑅𝐴 2 𝑅𝑅
𝑋𝛼 𝑋1−𝛼
2 2
Nivel de significancia α
Valor Experimental
(𝒏−𝟏)𝑺𝟐
𝑋2= V = 𝜎02

Regla de Decisión

Si V <𝑋𝛼2 o 2
V >𝑋1−𝛼 → Rechazar 𝐻0
2 2

Si 𝑋𝛼2 ≤V o 2
V≤𝑋1−𝛼 → No Rechazar 𝐻0
2 2
EE517-1453-INFERENCIA ESTADÍSTICA

PRUEBA DE HIPOTESIS PARA LA RAZON DE VARIANZAS

Sea 𝑥1 , 𝑥2 , 𝑥3 ,…… 𝑥𝑛1 una m.a. extraída de una población N (𝜇1 , 𝜎12 ). Y 𝑦1, 𝑦2 , 𝑦3 ,…… 𝑦𝑛2
una m.a. extraída de una población N (𝜇2 , 𝜎22 ). Ambas poblaciones independientes

Casi 1
PRUEBA UNILATERAL HACIA LA DERECHA

𝐻0 : 𝜎12 ≤𝜎22

𝐻1 : 𝜎12 >𝜎22
𝑅𝐴 𝑅𝑅
𝐹1−𝛼,(𝑛1−1,𝑛2 −1)
Nivel de significancia α

Estadístico de Contraste

𝑺𝟐𝟏
⁄ 2
𝜎1
𝑺𝟐𝟐
~ 𝑭(𝑛1−1,𝑛2 −1)
⁄ 2
𝜎2

Valor Experimental

𝑺𝟐
F= V = 𝑺𝟏𝟐
𝟐

Regla de Decisión

Si V >𝐹1−𝛼 → Rechazar 𝐻0
Si V ≤𝐹1−𝛼 → No Rechazar 𝐻0

Casi 2
PRUEBA UNILATERAL HACIA LA IZQUIERDA

𝐻0 : 𝜎12 ≥𝜎22

𝐻1 : 𝜎12 <𝜎22 𝛼
𝑅𝑅 𝑅𝐴
𝐹𝛼,(𝑛1−1,𝑛2 −1)

Nivel de significancia α
EE517-1453-INFERENCIA ESTADÍSTICA

Valor Experimental

𝑺𝟐
V = 𝑺𝟏𝟐
𝟐

Regla de Decisión

Si V <𝐹𝛼 → Rechazar 𝐻0
Si V ≥𝐹𝛼 → No Rechazar 𝐻0

Casi 3
PRUEBA BILATERAL

𝐻0 : 𝜎12 =𝜎22

𝐻1 : 𝜎12 ≠𝜎22 𝜶
𝟐 𝜶
𝟐
𝑅𝑅 𝑅𝐴 𝑅𝑅
𝐹𝛼 𝐹1−𝛼
2 2

Nivel de significancia α

El contraste y Valor Experimental

𝑺𝟐
V = 𝑺𝟏𝟐
𝟐

Regla de Decisión

Si V <𝐹𝛼 ⋁ V >𝐹1−𝛼 → Rechazar 𝐻0


2 2

Si 𝐹𝛼 ≤ V ≤ 𝐹1−𝛼 → No Rechazar 𝐻0
2 2
EE517-1453-INFERENCIA ESTADÍSTICA

EJEMPLOS
1) En un proceso de fabricación se plantea la hipótesis que la desviación
Estándar de las longitudes de cierto tipo de tornillo es 2mm. En una muestra
de diez tornillos elegidos al azar del proceso de producción se obtuvo una
desviación estándar de 2.60mm. Con estos datos ¿Se justifica la suposición
que la desviación estándar verdadera es 2mm?
Usar α=0.05 y suponga que la distribución de las longitudes es normal.
Solución

𝐻0 : 𝜎 2 =4
𝐻1 : 𝜎 2 ≠4
𝜶
α=0.05 𝟐 𝜶
𝟐
𝐸𝑆𝑇𝐴𝐷𝐼𝑆𝑇𝐼𝐶𝑂 𝑅𝑅 𝑅𝐴 𝑅𝑅
(𝒏−𝟏)𝑺𝟐 2 𝑋𝛼2 =2.70 2
𝑋1−𝛼 = 19.02
~ 𝑋𝑛−1 2 2
𝝈𝟐

(𝟗)(𝟐.𝟔𝟎)𝟐
V= = 15.21
𝟐𝟐
2
𝑋0.025,9 = 2.70
2
𝑋0.975,9 = 19.02
Decisión el valor 15.21 no pertenece a la región critica, por lo que no se debe
rechazar 𝐻0 . Finalmente, se concluye que la varianza de la población es igual
a 4 a un nivel de significancia del 5%.
2) Un biólogo cree que la varianza de vida de cierto organismo al ser expuesto
a cierto agente mortal es a lo mas 625 minutos al cuadrado. Una muestra
aleatoria de 15 organismos dio una varianza de 1225 ¿Proporcionan estos
datos evidencia suficiente como para concluir la investigación del biólogo
acerca de que la variabilidad es incorrecta?

𝐻0 : 𝜎 2 ≤625

𝐻1 : 𝜎 2 >625
α=0.05
𝑅𝐴
2 𝑅𝑅
ESTADÍSTICO
𝑋0.95,4= 23.7
(𝒏−𝟏)𝑺𝟐 2
~ 𝑋𝑛−1
𝝈𝟐
(𝟏𝟒)(𝟏𝟐𝟐𝟓)
V= = 27.44
𝟔𝟐𝟓

Decisión. El valor 27.44 pertenece a la región critica por lo que se debe rechazar 𝐻0 , Finalmente
los datos proporcionados por el biólogo acerca de la variabilidad son incorrecta con un riesgo del 5%
EE517-1453-INFERENCIA ESTADÍSTICA

3) Dos muestras consistentes de 25 y 12 observaciones tienen varianzas 𝑆𝑥2 =36 y 𝑆𝑦2 =9


respectivamente, Examinar la hipótesis que la primera varianza poblacional es mayor que la
segunda a un nivel de significancia de 0.01.

Solución

𝑛1 =25 𝑆𝑥2 =36 𝐻0 : 𝜎𝑥2 ≤ 𝜎𝑦2

𝑛2 =12 𝑆𝑦2 =9 𝐻1 : 𝜎𝑥2 > 𝜎𝑦2


α=0.01

𝑅𝐴 𝑅𝑅
𝐹0.99,(24,11)=4.02

𝑺𝟐𝟏 𝟑𝟔
F= = =4
𝑺𝟐𝟐 𝟗

Decisión- Se acepta 𝐻0 a un nivel de significancia 1% es decir las varianzas


poblacionales son iguales, se ha probado la homogeneidad de varianzas es decir la
varianza poblacional 1era es mayor que la segunda
EJERCICIOS
1) Dados las siguientes muestras correspondientes al porcentaje de desgaste de
neumáticos después de recorrer 20 000km con 2 marcas de neumáticos
diferentes x e y.

Muestra X
51, 42, 49, 55, 46, 63, 56, 38, 47, 39, 47
Muestra Y
38, 49, 45, 29, 31, 35
Si el porcentaje de desgaste sigue un modelo normal.

a) Pruebe que las varianzas de ambas marcas de neumáticos son iguales a un


nivel de significancia del 5%
b) Un técnico afirma que la marca X produce mayor porcentaje promedio de
desgaste que la marca Y. Pruebe si tal afirmación es verdadera con α=0.05.
2) Una empresa empacadora de azúcar está considerando una maquina nueva,
para reemplazar su máquina actual. Los pesos de una muestra de 21 paquetes
empacados por la máquina vieja una varianza de 0.16 mientras que la maquina
nueva da una varianza 0.009. En base a estos datos ¿Aconsejaría usted al gerente
a comprar la maquina nueva? Use α=0.01
EE517-1453-INFERENCIA ESTADÍSTICA

3) Suponga que los pesos de los artículos producidos en 2 procesos de fabricación


distintos se distribuyen normalmente. Si los pesos de una primera muestra de
tamaño 15 correspondiente al primero proceso tiene una varianza de 33,
mientras que una segunda muestra de tamaño 41 corresponde a una varianza
de 15 con α = 0.10 probar 𝜎12 ≠𝜎22

4) En un intento por determinar si la desviación estándar de los pesos de los niños


es mayor que de las niñas se obtuvieron:

Niños: 𝑠1 = 6.3 𝑛1 = 25
Niñas: 𝑠2 = 3.9 𝑛2 = 10
α=0.05
EE517-1453-INFERENCIA ESTADÍSTICA

SEMANA 12
EE517-1453-INFERENCIA ESTADÍSTICA

PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS

Caso 1
Poblaciones independientes y varianzas conocidas
Prueba unilateral hacia la derecha

𝐻0 : 𝜇1 ≤𝜇2 ⋁ 𝐻0 : 𝜇1 − 𝜇2 ≤ 𝛿
𝐻1 : 𝜇1 >𝜇2 𝐻1 : 𝜇1 − 𝜇2 > 𝛿
Nivel de significancia α 𝑅𝐴 𝑍𝛼 𝑅𝑅

Estadístico de Contraste

̅ ̅𝟐−(𝜇1 −𝜇2 )
𝒙𝟏 −𝒙
~ 𝑁(0,1)
𝝈𝟐 𝝈𝟐
√ 𝟏+ 𝟐
𝒏𝟏 𝒏𝟐

Valor Experimental

̅𝟏 −𝒙
𝒙 ̅𝟐−(𝛿)
V0 =
𝝈 𝟐𝝈 𝟐
√ 𝟏+ 𝟐
𝒏𝟏 𝒏𝟐

Regla de Decisión

Si 𝑉0 >𝑍𝛼 → Rechazar 𝐻0
Si V ≤𝑍𝛼 → No Rechazar 𝐻0

PRUEBA UNILATERAL HACIA LA IZQUIERDA

𝐻0 : 𝜇1 ≥𝜇2 ⋁ 𝜇1 − 𝜇2≥ 𝛿
𝐻1 : 𝜇1 <𝜇2 ⋁ 𝜇1 − 𝜇2 < 𝛿 𝛼
𝑅𝑅 𝑅𝐴
𝑍𝛼

Nivel de significancia α

Estadístico de Contraste
EE517-1453-INFERENCIA ESTADÍSTICA

̅𝟏 −𝒙
𝒙 ̅𝟐−(𝜇1 −𝜇2 )
~ 𝑁(0,1)
𝝈𝟐 𝝈𝟐
√ 𝟏+ 𝟐
𝒏𝟏 𝒏𝟐

Valor Experimental

̅𝟏 −𝒙
𝒙 ̅𝟐−(𝛿)
V0 =
𝝈𝟐 𝝈 𝟐
√ 𝟏+ 𝟐
𝒏𝟏 𝒏𝟐

Regla de Decisión
Si 𝑉0 <𝑍𝛼 → Rechazar 𝐻0
Si V ≥𝑍𝛼 → No Rechazar 𝐻0

PRUEBA BILATERAL
𝐻0 : 𝜇1 =𝜇2
𝐻1 : 𝜇1 ≠𝜇2 𝛼
𝛼
𝑅𝑅
𝑅𝑅 −𝑍𝛼 𝑅𝐴 𝑍𝛼
- 2 2

-
-

Regla de Decisión

Si |𝑉0 | >𝑍𝛼 → Rechazar 𝐻0


2

Si |𝑉0 | ≤𝑍𝛼 → No Rechazar 𝐻0


2

Caso 2
Poblaciones independientes y varianzas desconocida 𝑛1 + 𝑛2 >30
Prueba unilateral hacia la derecha

𝐻0 : 𝜇1 ≤𝜇2 ⋁ 𝐻0 : 𝜇1 − 𝜇2 ≤ 𝛿
𝐻1 : 𝜇1 >𝜇2 𝐻1 : 𝜇1 − 𝜇2 > 𝛿
Nivel de significancia α 𝑅𝐴 𝑍𝛼 𝑅𝑅

Estadístico de Contraste
EE517-1453-INFERENCIA ESTADÍSTICA

̅𝟏 −𝒙
𝒙 ̅𝟐−(𝜇1 −𝜇2 )
~ 𝑁(0,1)
𝒔 𝟐
𝒔 𝟐
√ 𝟏+ 𝟐
𝒏𝟏 𝒏𝟐

Valor Experimental

̅𝟏 −𝒙
𝒙 ̅𝟐−(𝛿)
V0 =
𝒔 𝒔 𝟐 𝟐
√ 𝟏+ 𝟐
𝒏𝟏 𝒏𝟐

Regla de Decisión

Si 𝑉0 >𝑍𝛼 → Rechazar 𝐻0
Si V ≤𝑍𝛼 → No Rechazar 𝐻0

PRUEBA UNILATERAL HACIA LA IZQUIERDA

𝐻0 : 𝜇1 ≥𝜇2 ⋁ 𝜇1 − 𝜇2≥ 𝛿
𝐻1 : 𝜇1 <𝜇2 ⋁ 𝜇1 − 𝜇2 < 𝛿 𝛼
𝑅𝑅 𝑅𝐴
𝑍𝛼

Nivel de significancia α

Estadístico de Contraste
̅𝟏 −𝒙
𝒙 ̅𝟐−(𝜇1 −𝜇2 )
~ 𝑁(0,1)
𝒔𝟐
𝟏 𝒔𝟐
𝟐
√ +
𝒏𝟏 𝒏𝟐

Valor Experimental

̅𝟏 −𝒙
𝒙 ̅𝟐−(𝛿)
V0 =
𝒔 𝒔 𝟐 𝟐
√ 𝟏+ 𝟐
𝒏𝟏 𝒏𝟐

Regla de Decisión
Si 𝑉0 <𝑍𝛼 → Rechazar 𝐻0
Si V ≥𝑍𝛼 → No Rechazar 𝐻0
EE517-1453-INFERENCIA ESTADÍSTICA

PRUEBA BILATERAL
𝐻0 : 𝜇1 =𝜇2
𝐻1 : 𝜇1 ≠𝜇2 𝛼
𝛼
𝑅𝑅
𝑅𝑅 −𝑍𝛼 𝑅𝐴 𝑍𝛼
- 2 2

-
-
Regla de Decisión

Si |𝑉0 | >𝑍𝛼 → Rechazar 𝐻0


2

Si |𝑉0 | ≤𝑍𝛼 → No Rechazar 𝐻0


2

Caso 3
Poblaciones independientes y varianzas desconocidas 𝑛1 + 𝑛2 ≤30
Prueba unilateral hacia la derecha

𝐻0 : 𝜇1 ≤𝜇2 ⋁ 𝐻0 : 𝜇1 − 𝜇2 ≤ 𝛿
𝐻1 : 𝜇1 >𝜇2 𝐻1 : 𝜇1 − 𝜇2 > 𝛿
Nivel de significancia α 𝑅𝐴 𝑇𝛼,(𝑛1𝑅𝑅
+𝑛2 −2)

Estadístico de Contraste 𝜎12 =𝜎22 (Desconocidos)


̅𝟏 −𝒙
𝒙 ̅𝟐−(𝜇1 −𝜇2 )
𝟏 𝟏
~ 𝑇𝑛1+𝑛2−2
√𝑺𝟐𝒑 (𝒏 +𝒏 )
𝟏 𝟐

Si 𝜎12 ≠𝜎22 (Desconocidos)


̅𝟏 −𝒙
𝒙 ̅𝟐−(𝝁𝟏 −𝝁𝟐 )
~ 𝑇𝑔
𝒔𝟐
𝟏 𝒔𝟐
𝟐
√ +
𝒏𝟏 𝒏𝟐

𝑅𝐴 𝑅𝑅
Regla de Decisión 𝑇𝛼(𝑔)
Si 𝑉0 >𝑇𝛼 → Rechazar 𝐻0
Si 𝑉0 ≤𝑇𝛼 → No Rechazar 𝐻0
EE517-1453-INFERENCIA ESTADÍSTICA

CONTRASTE PARA UNA PROPORCIÓN


Sea 𝑦1, 𝑦2 , 𝑦3 ,……… 𝑦𝑛 una m.a. extraída de una población B (1, π) y el estadístico
∑𝑦 𝑋
𝑃̅= 𝑛 𝑖 = 𝑛

X ~ b (n, π)
Para n →∞
π(1−π)
𝑃̅ ~ N (π, 𝑛 )

CONTRASTE UNILATERAL HACIA LA DERECHA


𝐻0 : 𝜋≤𝜋0
𝐻1 : 𝜋>𝜋0
Nivel de significancia α
Estadístico de Contraste
𝑃̅−(π)
~ 𝑁(0,1)
π(1−π)

𝑛 𝑍𝛼

Valor Experimental
𝑃̅−(π0 ) 𝑃̅−(π0 )
V0 = ⋁
π (1−π0 ) π (1−π0 ) 𝑁−𝑛
√ 0 √ 0 ( )
𝑛 𝑛 𝑁−1

Regla de Decisión
Si 𝑉0 >𝑍𝛼 → Rechazar 𝐻0
Si 𝑉0 ≤𝑍𝛼 → No Rechazar 𝐻0
CONTRASTE UNILATERAL HACIA LA IZQUIERDA
𝐻0 : 𝜋≥𝜋0

𝐻1 : 𝜋<𝜋0
Nivel de significancia α
Estadístico de Contraste
𝑃̅−(π)
~ 𝑁(0,1)

π(1−π) −𝑍𝛼
𝑛

Valor Experimental
𝑃̅−(π0 ) 𝑃̅−(π0 )
V0 = ⋁ Regla de Decisión
π (1−π0 ) π (1−π0 ) 𝑁−𝑛
√ 0 √ 0 ( )
𝑛 𝑛 𝑁−1

Si 𝑉0 <−𝑍𝛼 → Rechazar 𝐻0
Si 𝑉0 ≥−𝑍𝛼 → No Rechazar 𝐻0
EE517-1453-INFERENCIA ESTADÍSTICA

CONTRASTE BILATERAL
𝐻0 : 𝜋=𝜋0
𝐻1 : 𝜋≠𝜋0
Nivel de significancia α
𝛼
Estadístico de Contraste 𝛼
𝑃̅−(π) 𝑅𝑅 𝑅𝐴 𝑍𝛼 𝑅𝑅
~ 𝑁(0,1) 𝑍𝛼
π(1−π) 2 2

𝑛

Valor Experimental
𝑃̅−(π0 ) 𝑃̅−(π0 )
V0 = ⋁ Regla de Decisión
π (1−π0 ) π (1−π0 ) 𝑁−𝑛
√ 0 √ 0 ( )
𝑛 𝑛 𝑁−1

Si |𝑉 |>𝑍𝛼 → Rechazar 𝐻0
2

Si |𝑉 |≤𝑍𝛼 → No Rechazar 𝐻0
2

CONTRASTE PARA LA DIFERENCIA DE PROPORCIONES

Sea 𝑦1 ∼B (1, 𝜋1) De la cual se extrae una muestra de tamaño 𝑛1 y 𝑦2 ∼B (1, 𝜋2 ) de la


cual se extrae una muestra de tamaño 𝑛2 Ambas poblaciones independientes
𝜋 (1−𝜋1 ) 𝜋 (1−𝜋2 )
𝑃̅1- 𝑃̅2 ∼ (𝜋1 − 𝜋2 , 1 + 2 )
𝑛1 𝑛2

PRUEBA UNILATERAL HACIA LA DERECHA


𝐻0 : 𝜋1≤𝜋2
𝐻1 : 𝜋1>𝜋2
Nivel de significancia α
Estadístico de Contraste
𝑃̅1 − 𝑃̅2 −(𝜋1 −𝜋2)
𝜋 (1−𝜋 ) 𝜋 (1−𝜋 )
~ 𝑁(0,1) 𝑍𝛼
√ 1𝑛 1+ 2𝑛 2
1 2

PRUEBA UNILATERAL HACIA LA IZQUIERDA


𝐻0 : 𝜋1≥𝜋2
𝐻1 : 𝜋1<𝜋2

𝑍𝛼
EE517-1453-INFERENCIA ESTADÍSTICA

PRUEBA BILATERAL
𝐻0 : 𝜋1=𝜋2
𝐻1 : 𝜋1≠𝜋2

−𝑍𝛼 𝑍𝛼
2 2

Estadístico de Contraste
𝑃̅1 − 𝑃̅2 −(𝜋1−𝜋2 )
Z= 𝜋 (1−𝜋 ) 𝜋 (1−𝜋 )
√ 1𝑛 1+ 2𝑛 2
1 2

Como 𝜋1 y 𝜋2 son desconocidos hay que estimar con 𝑃𝑐

Valor Experimental
𝑃̅1 − 𝑃̅2
V= 𝑃 (1−𝑃 ) 𝑃 (1−𝑃 )
√ 𝑐𝑛 𝑐+ 𝑐𝑛 𝑐
1 2

𝑃𝑐 es el valor común de los parámetros de 𝜋1 y 𝜋2


𝑛1 𝑃̅1 +𝑛1 𝑃̅1
𝑃𝑐 = 𝑛1 +𝑛2

𝑋 +𝑋
𝑃𝑐 = 𝑛1 +𝑛2
1 2

EJEMPLOS
1) Un candidato afirma que tiene apoyo del 65% de los electores de su distrito ¿Qué
conclusión podemos obtener si en una m.a. de 500 electores 245 expresaron su
preferencia por él? α=0.01
Solución:
n=500 𝐻0 : 𝜋=0.65
x= 245 𝐻1 : 𝜋≠0.65
245
𝑃̅=500 = 0.49 𝑅. 𝐴

𝑃̅−(π0 )
𝑅. 𝑅 −𝑍𝛼 𝑍𝛼 𝑅. 𝑅
2 2
π (1−π0 )
√ 0
𝑛
−2.57571 2.57571
0.49−(0.65 ) −0.16
Z=
0.65(0.35)
= 0.021330

500

Z= - 7.50117
EE517-1453-INFERENCIA ESTADÍSTICA

Se rechaza 𝐻0 si
|𝑧| >𝑧𝑐 𝑧 >𝑧𝑐 ∨ 𝑧 < −𝑧𝑐
-7.50117< -2.575
Se rechaza 𝐻0 al N.S. del 1%. Es decir, se concluye que el candidato no tiene el
65% de electores a su favor al 1% de nivel de significancia.
2) Una encuesta de opinión publica se consulta a 400 varones y 600 mujeres acerca
de un proyecto municipal. El 70% de los varones y el 75%de las mujeres
expresaron su aprobación al proyecto utilizando α= 0.05
¿Puede concluirse que la diferencia observada es significativa?
Solución
𝐻0 : 𝜋1=𝜋2
𝐻1 : 𝜋1≠𝜋2
𝛼 𝛼
α= 0.05
2 𝑅𝐴 2
𝑃̅1=0.70
𝑃𝐶 = 0.73 −1.96 1.96
𝑃̅2=0.75
0.70−(0.75 )
V= 1 1
= -1 .74475
√(0.73)(0.27)( + )
400 600

-1 .74475 Cae en la región de aceptación. No se rechaza 𝐻0 al N.S. del 5%.


Es decir, se concluye que la diferencia observada es No significativa al N.S. 5%
3) Una aerolínea afirma que, a lo sumo, el 5% de todos los equipajes perdidos no
se encuentran.
a) Si en una m.a. de 17 de 200 artículos de equipaje no son encontrados pierde la
Hipótesis de que la proporción de equipaje perdido es superior al 6% con un nivel
de significancia del 0.05
b) Trabajar con α=0.10
4) De un estudio sobre la incidencia de la hipertensión en la Provincia en Málaga, se sabe
que en la zona rural el porcentaje de hipertensos es del 27.7% tras una encuesta a 400
personas de una zona urbana, se obtuvo un 24% de Hipertensos
a. Se puede decir que el porcentaje de Hipertensos en la zona urbana es distinto
que en la zona rural.
b. ¿Es menor el porcentaje de Hipertensos en la zona urbana que en la zona
rural? Suponga distribución normal.
EE517-1453-INFERENCIA ESTADÍSTICA
EE517-1453-INFERENCIA ESTADÍSTICA

EJERCICIOS
1) Un analista financiero está interesado en comparar los niveles de
rendimiento en puntos porcentuales, de dos empresas de sectores
diferentes 1 y 2. El sabe que las tasas de rendimiento de cada una de
estas empresas tienen una distribución normal. Selecciono al azar 16
acciones de cada una de las empresas y observó las tasas de
rendimiento. Las tasas de rendimiento dieron las medias 45 y 38 y las
varianzas 128 y 64 respectivamente para las empresas 1 y 2 al nivel
de significación 1%
a. ¿Son diferentes las dos varianzas poblacionales de las tasas de
rendimiento?
b. ¿Es la tasa de rendimiento promedio de la empresa 1 mayor
que la de la empresa 2?
2) Dos profesores enseñan a dos secciones A y B el mismo curso de
Estadística. Para comparar los promedios en las calificaciones
obtenidas con los dos profesores, se escogieron dos muestras
aleatorias independientes de 9 notas de A y 8 notas de B dando los
siguientes resultados:

GRUPO A : 02-18-10-20-17-05-12-16-11
GRUPO B : 12-16-09-16-12-13-11-10

Suponga que las calificaciones con cada uno de los 2 profesores se


distribuyen normalmente con un nivel de significación de 0.02
a) ¿Cuál es la calificación promedio de A mas alta que la de B?
3) En un estudio para comparar la venta semanal de arroz en los
hipermercados 1 y 2 se escogieron el monto de las ventas de 8 días
al azar resultando los siguientes datos en U.M.
MERCADO I : 1.5- 1.7-1.6-1.8-1.7-1.9-1.2-1.3
MERCADO II : 1.2-1.0-1.3-1.1-1.2-1.5-1.4-1.5

Suponga que las ventas en cada uno de los supermercados tienen


una distribución normal usar α=0.01
a) ¿Se puede concluir que las varianzas de las ventas son iguales?
b) ¿Se puede concluir que existe alguna diferencia significativa en las
ventas medias?
EE517-1453-INFERENCIA ESTADÍSTICA

4) Una agencia de publicidad realizó un estudio para comparar la


efectividad de un anuncio en la radio en 2 distritos. Después de
defender dicho anuncio. Se realizó una encuesta telefónica con 600
personas seleccionadas al azar, que viven en cada uno de los 2
distritos resultando las proporciones del 20% y 18% respectivamente
usar α=0.05.
¿Es posible concluir que la proporción de las personas que
escucharon dicho aviso en el 1er distrito es superior a la del 2do
distrito?
5) El número de accidentes mortales en una ciudad es en promedio de
12 mensuales tras una campaña de señalización de las vías urbanas
se contabilizaron en 6 meses sucesivos 8, 11, 9, 7, 10 y 9 accidentes
mortales ¿Fue efectivo la campaña?
Suponga normalidad
6) Un Supervisor de control de calidad de una empresa fabricante de
automóviles está preocupado por la uniformidad del # de defectos
en los automóviles que salen de la línea de ensamble. Si una línea de
ensamble tiene una variabilidad significativamente mayor en el # de
defectos entonces es necesario hacer cambios. El supervisor reunió
los siguientes datos
Línea de Línea de
Ensamble A Ensamble B
𝑋̅ 10 12
𝑆2 9 25
n 21 16

¿La línea de ensamble B tiene una variabilidad significativamente


mayor en el número de defectos? Probar α=0.01

También podría gustarte