Está en la página 1de 72

CLASES DE ESTADISTICA APLICADA II

Muestreo:

Una parte de la estadística que se ocupa del estudio de los diferentes métodos y técnicas que se
utilizan para seleccionar muestras representativas de la población

Clases de muestreo

Probabilístico

No probabilístico

Probabilístico: cuando se le asigna una determinada probabilidad en su elección

Muestreo aleatorio simple:

Se aplica a poblaciones homogéneas, esto es todos los elementos tienen las mismas
probabilidades de ser elegidas

Muestreo estratificado:

Se aplica cuando la población se encuentra segmentada en una serie de sub poblaciones


homogéneas a las que se les llama estratos

Muestreo por conglomerados:

Se aplica cuando el muestreo se efectúa por etapas

Muestreo sistemático:

Se aplica cuando la población es heterogénea

Muestreo no probabilístico

Muestreo aleatorio

Experimento aleatorio:

Espacio muestral, Población, Universo

Variable aleatoria

Función de probabilidad

Distribución de probabilidades

Parámetros

Seleccionamos una muestra aleatoria de tamaño n

Si la población es finita se selecciona un número finito de muestras

Si el muestreo es sin reposición el número de muestras posibles será


k=¿ ( N ¿ ) ¿ ¿¿
¿ y si el muestreo es con reposición será k = N n

Si la población es infinita se seleccionan infinitas muestras

Distribución de media muestral

Sea X una variable aleatoria que se distribuye con

E(X) = µ

V(X) = σ2

Seleccionamos una muestra aleatoria de tamaño n

Si la población es infinita se selecciona infinitas muestras, si la población es finita se selecciona k


muestras donde

k=¿ ( N ¿ ) ¿ ¿¿
¿ si el muestreo es sin reposición

k = Nn si el muestreo es con reposición

entonces

X = media muestral se distribuye con

E( X ) = µ

σ2
V( X ) = n si el muestreo es con reposición o la muestra proviene de poblaciones infinitas

σ 2 N−n
V( X ) = n N−1
( ) si el muestreo es sin reposición de una población finita

Sea:

X 0 1 2 3 4 sumas
P(X) 0.2 0.2 0.2 0.2 0.2 1
XP(X) 0 0.2 0.4 0.6 0.8 2
X2P(X) 0 0.2 0.8 1.8 3.2 6

E(X) = 2 E(X2) = 4

V(X) = E(X2) – [E(X)]2 = 6 – 4 = 2

Seleccionamos una muestra aleatoria de tamaño n = 2 sin reposicion

K = 5C2 = 10
Xi Xi 2
Nº Muestra P( P( Xi P(
Xi Xi ) Xi )
)
1 0,1 0.5 0.1 0.05 0.025
2 0,2 1 0.1 0.1 0.1
3 0,3 1.5 0.1 0.15 0.225
4 0,4 2 0.1 0.2 0.4
5 1,2 1.5 0.1 0.15 0.225
6 1,3 2 0.1 0.2 0.4
7 1,4 2.5 0.1 0.25 0.625
8 2,3 2.5 0.1 0.25 0.625
9 2,4 3 0.1 0.3 0.9
10 3,4 3.5 0.1 0.35 1.225
sumas 1 2 4.75

E( X ) = 2

V( X ) = 4.75 – 4 = 0.75

E( X ) = µ

2=2

σ 2 N−n
V( X ) = n N−1
( ) = (2/2)[(5-2)/(5-1) = ¾ = 0.75

Distribución de la media muestral proveniente de una población normal

Sea X  n(µ,σ2) seleccionamos una muestra aleatoria de tamaño n

X  n(µ, σ2/n)

La estatura de los estudiantes de la UNI es considerada como una variable aleatoria normalmente
distribuida con media 165 cm y varianza 25cm 2 si se selecciona aleatoriamente una muestra de 25
estudiantes calcular P( X < 166)

X  n( 165, 1)

P( X < 166) = 0.841344746

Teorema central del limite


Sea X una variable aleatoria que se distribuye con

E(X) = µ

V(X) = σ2

Seleccionamos una muestra aleatoria de tamaño suficientemente grande (n > 30)

X se distribuye aproximadamente normal con

E( X ) = µ

2
σ
V( X ) = n

El peso de los estudiantes de la UNI se distribuye con

E(X) = 65

V(X) = 64

Si se selecciona una muestra aleatoria de tamaño n = 36

Calcular P( X < 66)

X  n (65, 64/36)

P( X < 66) = 0.773372648

X 0 0 1 1 1 Sumas
P(X) 0.2 0.2 0.2 0.2 0.2 1
X P(X) 0 0 0.2 0.2 0.2 0.6
X2 P(X) 0 0 0.2 0.2 0.2 0.6

E(X) = 0.6 = P, Q = 1 –P = 0.4

V(X) = 0.24 = E(X2 ) – [E(X)]2 = 0.6 – 0.36 = 0.24 = P*Q = 0.6*0.4 = 0.24

Distribución de la proporción muestral

Sea X una variable aleatoria que toma valores 0 y 1 asignándole el 1 a los elementos de la clase de
interés de estudio y 0 a los elementos de la clase complementaria
E(X) = P = proporción poblacional

V(X) = PQ

Seleccionamos una muestra aleatoria de tamaño n

p = proporción muestral se distribuye con

E(p) = P

PQ
V(p) = n si el muestreo es con reposición o las muestras provienen de poblaciones infinitas

PQ N −n
V(p) = n N−1 ( ) si el muestreo es sin reposición de una población finita

Sea X una variable aleatoria que se distribuye

X 0 0 1 1 1 Sumas
P(X) 0.2 0.2 0.2 0.2 0.2 1
X P(X) 0 0 0.2 0.2 0.2 0.6
X2 P(X) 0 0 0.2 0.2 0.2 0.6

P = 0.6, Q = 1 – P = 0.4

Seleccionar una muestra aleatoria de tamaño n = 2 sin reposición

N = 5, n = 2, el número de muestras posibles será k = 5C2 = 10

Nº Muestra p P(p) pP(p) p2P(p)


1 0, 0 0 0.1 0 0
2 0, 1 0,5 0.1 0.05 0.025
3 0, 1 0,5 0.1 0.05 0.025
4 0, 1 0,5 0.1 0.05 0.025
5 0, 1 0,5 0.1 0.05 0.025
6 0, 1 0,5 0.1 0.05 0.025
7 0, 1 0,5 0.1 0.05 0.025
8 1, 1 1 0.1 0.1 0.1
9 1, 1 1 0.1 0.1 0.1
10 1, 1 1 0.1 0.1 0.1
sumas 1 0.6 0.45

E(p) = 0.6

V(p) = 0.45 – 0.36 = 0.09

E(p) = P = 0.6
PQ N −n
V(p) = n N−1 ( ) = (0.6*0.4/2)[(5-2)/(5-1)] = (0.12)((3/4) = 0.36/4 = 0.09

Si el tamaño de la muestra es suficientemente grande (n > 30) por el teorema central del limite

p  n[P, V(p)]

se sabe que el 80% de estudiantes de la UNI son varones, si se selecciona aleatoriamente una
muestra de 50 alumnos, calcular P (p > 0.82)

P = 0.80, Q = 0.20

n = 50

E(p) = 0.80

V(p) = 0.16/50 = 0.0032

P(p > 0.82) = 0.3618368

Distribución de la diferencia de medias muestrales

Sean X e Y dos variables aleatorias que se distribuyen con

E( X )=μ x , V ( X )=σ 2x
E(Y )=μ y , V (Y )=σ 2y

Respectivamente

Seleccionamos muestras aleatorias de tamaño n x , ny respectivamente

X −Y diferencia de medias muestrales, se distribuye con

E( X −Y ) =
μ x −μ y

V( X −Y ) = V( X ) + V( Y )

Distribución de la diferencia de medias muestrales provenientes de poblaciones normales

Sean:

2
X n (
μx , σx )
2
Y n(
μy ,
σy )

Entonces

σ 2x σ 2y
+
X −Y  n(
μx -
μy ,
nx ny )

La estatura de los estudiantes varones de la UNI se distribuye normalmente con media 165cm y
varianza 64 cm2, asimismo la estatura de las mujeres se distribuye normalmente con media 160cm
y varianza 36cm2 , si se selecciona una muestra aleatoria de 25 varones y 25 mujeres.

Calcular P( X <Y )

E( X −Y ) =
μx -
μy = 165 – 160 = 5

2 2
σx σ y
+
V( X −Y ) =
nx ny = 100/25 = 4

X −Y  n(5, 4)

P( X <Y ) = P( X −Y < 0) = 0.00620967

Distribución de la diferencia de proporciones muestrales

Distribuciones de pequeñas muestras(muestras exactas)

Distribución Chi – cuadrado

Distribución t

Distribución F

Distribución de la diferencia de proporciones muestrales

Sean X e y dos variables aleatorias que se distribuyen con P x y Py proporciones poblacionales de las
clases de interés respectivamente.

Seleccionamos muestras aleatorias de tamaño n x, ny respectivamente

px – py : diferencia de proporciones muestrales , se distribuye con:

E(px – py) = C

V(px – py) = V(px) + V(py)

Si nx + ny > 30 por el teorema central del limite


Px Qx Py Q y
+
px – py n(px – py, nx ny )

Se sabe que el 90% de estudiantes varones de la FIEECS y el 85% de mujeres aprueban el curso de
matemática II, si se selecciona una muestra aleatoria de 25 varones y 25 mujeres. Calcular la
probabilidad de que en dicha muestra existan más aprobadas que aprobados

Sean

X: estudiantes varones matriculados en Matemática II

Y: estudiantes mujeres matriculadas en Matemática II

Px: proporción de estudiantes varones que aprueban matemática II

Py : proporción de estudiantes mujeres que aprueban matemática II

Px = 0.90 Qx = 0.10

Py = 0.85 Qy = 0.15

Seleccionamos muestras aleatorias de tamaño

nx = 25, ny = 25

px – py  n(0.05, 0.0087)

P(px < py) = 0.29595

Una compañía de investigación de mercado desea realizar un análisis comparativo sobre el


consumo de un determinado producto en personas adultas de ambos sexos. Se cree que el 30% de
las mujeres y el 20% de los hombres aceptan dicho producto. Si el análisis pasa por la selección de
una muestra de 200 hombres y 200 mujeres, elegidos al azar, ¿cuál es la probabilidad de que las
mujeres acepten más que los hombres tal producto.

Solución

Px: Proporción de mujeres que aceptan disco producto

Py: Proporción de varones que aceptan disco producto

Px = 0.3 Qx = 0.7

Py = 0.2 Qy = 0.8

nx = 200 ny = 200

px - py n( 0.10, 0.00185)

0 0.10
P(px > py) = P(px - py > 0) = 1 - P(px - py < 0) = 0.989962757

Inmobiliaria S.A. gestiona la administración de algunas viviendas de las urbanizaciones LOS ROBLES
y de LOS CEDROS. En la primera de un total de 500 casas, 160 están alquiladas; y en los CEDROS de
un total de 600 están alquiladas 168 viviendas.
Se escogen sendas muestras que contienen el 10% de viviendas de sus respectivas
urbanizaciones y se desea conocer la probabilidad de obtener una diferencia entre la
proporción de casas en alquiler mayor que 0.08.

Solución

Px = proporción de viviendas alquiladas el Los Robles

Py = proporción de viviendas alquiladas el Los Cedros

Px = 0.32 Qx = 0.68

Py = 0.28 Qy = 0.72

nx = 50 ny = 60

px – py  n( 0.04, 0.007712)

P(│px – py│> 0.08) = P(px – py > 0.08) + P(px – py < -0.08)

P(│px – py│> 0.08) = 0.41027

Los temas de la primera practica son

Muestreo

Muestreo aleatorio

Distribuciones muestrales:

Distribución de la media muestral

Distribución de la media muestral proveniente de una población normal

Teorema central del limite

Distribución de la proporción muestral

Distribución de la diferencia de medias muestrales

Distribución de la diferencia de proporciones muestrales


Distribuciones de pequeñas muestras

Distribución Chi – Cuadrado

Distribución de la varianza muestral

Distribución t

Distribución de la media muestral proveniente de una población normal con varianza poblacional
desconocida

Distribución de la diferencia de medias muestrales provenientes de poblaciones normales con


varianzas poblacionales desconocidas.

Distribución F

Distribución de la razón de varianzas muestrales


Distribuciones de pequeñas muestras (muestras exactas)
Distribución Chi – Cuadrado
Distribución t
Distribución F

Distribución Chi – Cuadrado


Sea Z  n(0,1) decimos que
Z2 se distribuye como una Chi – cuadrado con un grado de libertad
2
Z2 
χ (1)

Grados de libertad
Numero de variables aleatorias independientes.
Propiedad aditiva de la Chi – cuadrada
Sean
2 2
Z1  n(0,1)
Z 1 → χ ( 1)
2 2
Z2 n(0,1)
Z 2 → χ ( 1)

.
.
.

Zn n(0,1)
Z 2n → χ(21)
n
∑ Z 2i → χ 2(n )
i =1

Características de la distribución Chi – Cuadrada


2
χ
E ( (n ) ) = n
2
V(
χ (n ) ) = 2n

Sea X una variable aleatoria normalmente distribuida


Sea X  n(µ,σ2)
Transformamos X en Z
Estandarizando X
2
X−μ X−μ
Z= σ  n(0,1) 2
Z =
( )
σ χ 2
 (1)
Sean X1, X2, …, Xn una serie de variables aleatorias independientes normalmente distribuidas esto
es
X 1−μ 1
X1  n(µ1,
2
σ1 )  Z1 = σ1  n(0,1) 
Z 21 → χ (21)
X 2 −μ 2
X2  n(µ2,
2
σ2 )  Z2 = σ2  n(0,1) 
Z 22 → χ (21)
.
.
.
X n −μn
2 2 2
Xn  n(µn, σ2 )  Zn = σn  n(0,1) 
Z n → χ( 1)

n n
X i −μi 2

i=1
Z 2i = ∑
i=1
( σi ) → χ (2n)

Distribución de la varianza muestral


Sea X  n(µ,σ2)
seleccionamos una muestra aleatoria de tamaño n
n n
∑ xi ∑ ( x i− X )2
X = i=1 S 2 = I =1
n , n−1
x1, x1, …, x1,
x 1 −μ
x1  σ  n(0,1)
x 2 −μ
x2  σ  n(0,1)
.
.
.
x n −μ
xn  σ  n(0,1)

n 2
x i −μ
∑( )
i =1 σ
→ χ (2n)

n 2
x −X + X −μ
∑( σ
i
) →χ 2
( n)
i =1

n 2
( x −X )+( X −μ)
∑( σ
i
) →χ 2
(n )
i=1

2
n
( (x i −X )+( X −μ ) )
∑ 2
→ χ 2( n)
i=1 σ
n 2 2
( x i− X ) +( X −μ) + 2( x i −X )( X−μ )
∑ 2
→ χ 2( n)
i=1 σ

2 n
n
( x i− X ) ( X −μ )2 n
2( xi −X ) ( X−μ )
∑ σ2
∑ σ2 ∑ σ2
i =1 + i=1 + i=1

2 n
n
( x i− X ) ( X −μ )2 2 ( X −μ )
n
∑ σ2
∑ σ2 ∑ ( x i −X )
σ 2 i =1
i =1 + i=1 +

2 n
n
( x i− X ) ( X −μ )2
∑ σ2
∑ σ2 2
χ (n )
i =1 + i=1 

n 2
( x i− X ) ( X−μ )2
(n−1 ) ∑ n 2
i=1 ( n−1 )σ 2 + σ2 
χ (n )
(n−1)S 2 X−μ 2

σ2
+
σ
√n ( ) 
2
χ (n )
2
( n−1 )S
+ z2 2
σ 2

χ (n )
2
(n−1 )S
+ χ(21) 2
σ 2 χ
 (n )

2
La varianza muestral S2 se distribuye como
χ (n−1)

Características de la varianza muestral


Esperanza

σ 2 ( n−1) S2 σ2 2 2
σ 2 (n−1)
E(S2) =
E
[ (n−1)σ 2 ] [ =
E
(n−1)
χ ( n−1)
] σ
= (n−1)
2
E( χ ( n−1) )
= (n−1) = σ2
E(S2) = σ2
Varianza

σ 2 (n−1)S 2 σ2 2 σ4 σ 4 2(n−1 )
V(S2) =
V
[ (n−1 )σ 2 ] [ =
V χ
(n−1 ) (n−1) ] = (n−1 )
2
V ( χ 2
( n−1 ) )
= ( n−1 )2
4

V(S2) = (n−1 )

Distribución t

Sean

Z  n(0,1)

U
χ 2(n )

El estadístico

Z
T=
U
√ n t
 (n)

Caracteristicas:
Esperanza:

t
E( (n) ) = 0

t(n)
V( ) = n/(n-2) para todo n > 2

Distribución de la media muestral proveniente de una población normal con varianza desconocida

Sea X  n(µ, σ2) seleccionamos una muestra aleatoria de tamaño n

Entonces
n n
∑ xi ∑ ( x i− X )2
X = i=1 S 2 = I =1
n , n−1

X  n(µ, σ2/n) estandarizando X

X−μ
Z=
σ
√n  n(0,1)
2
( n−1) S
U=
σ2 
χ 2(n−1)

Entonces el estadístico
X−μ
σ
T= √n
Z
( n−1) S 2

√ σ2
n−1 = √
2
χ (n−1)
n−1  t(n-1)

X−μ
σ
T= √n
( n−1) S 2 X−μ

√ σ2
n−1 =
S
√n  t(n-1)
Distribución de la diferencia de medias muestrales provenientes de poblaciones normales con

varianzas poblacionales desconocidas iguales (


σ 2x =σ 2y )

Sean

X  n( µx, σx2)

Y  n( µy, σy2)

Donde σx2 y σy2 son desconocidas iguales (σx2 = σy2 = σ2

Seleccionamos muestras aleatorias de tamaño n x, ny respectivamente


nx nx

∑ xi ∑ ( x i −X )2
i =1 2 i=1
X= S x=
nx , nx −1

ny ny

∑ yi ∑ ( y i −Y )2
i=1 i=1
Y= S 2y =
ny , n y −1

σ 2x σ 2y
X - Y  (
n μ x −μ y , +
nx n y )
σ2 σ2
X - Y  (
n μ x −μ y , +
nx n y )
( X−Y )−(μ x −μ y )
Z=
σ2 σ2
√ +
nx n y  n(0,1)

( nx −1)S 2x
U= χ 2(n x−1)
σ2 

2
(n y−1 )S y
V= 2 χ 2(n y−1)
σ 
2
(n x−1 )S2x (n y−1)S y
σ2 σ
2 χ 2(n +n −2)
U +V = +  x y

( X −Y )−( μ x−μ y )
σ2 σ2
√ +
nx ny

( n x−1 ) S2x +(n y −1) S 2y

T= √ σ2
n x +n y−2 
t( n +n −2)
x y

( X −Y )−( μ x−μ y )
1 1
√(σ2

2
+
nx ny )
2


(n x−1 )S x +(n y −1)S y
2
σ
n x +n y−2 t( n +n −2)
T=  x y

( X−Y )−( μ x −μ y )
(n x −1)S 2x +(n y−1 )S 2y 1 1

T= √ n x + n y −2
+
nx n y ( ) 
t( n +n −2)
x y

Distribución de la diferencia de medias muestrales provenientes de poblaciones normales con


2 2
varianzas poblacionales desconocidas diferentes (
σ x ≠σ y )

Sean X e Y dos variables aleatorias normalmente distribuidas con varianzas poblacionales


desconocidas diferentes, esto es:
2
X →n( μ x , σ x )

Y →n( μ y , σ 2y )
Seleccionamos muestras aleatorias de tamaño n x y ny respectivamente

X - Y : diferencia de medias muestrales se distribuye con


( X −Y )−( μ x−μ y )
X −Y = →t ( g)
2 2
Sx Sy
√ nx
+
ny

2
S 2x S 2y

g=
( +
nx n y ) −2
2 2
S2x S 2y
( ) ( )
nx
+
ny
n x−1 n y −1

Distribución F

Sean
2
χ
U → (n )
2
χ
V → (m)

U
n
→ F( n , m)
V
F m

Distribución de la razón de varianzas muestrales

Sean X e Y dos variables aleatorias normalmente distribuidas esto es:


2
X →n( μ x , σ x )

Y →n( μ y , σ 2y )
Seleccionamos muestras aleatorias de tamaño

nx, ny respectivamente
nx nx

∑ xi ∑ ( x i −X )2
i =1 2 i=1
X= S x=
nx , nx −1
ny ny

∑ yi ∑ ( y i −Y )2
i=1 i=1
Y= S 2y =
ny , n y −1

Sean

( nx −1)S 2x 2
U= → χ ( n −1)
σ 2x x

2
(n y −1)S y 2
V= 2
→ χ (n
y −1)
σy

2
( n x−1 ) S x
2
U σx
2
( n −1 ) ( n x−1 ) Sx
F= x =
V ( n y −1 ) S2y σ 2x
( n y −1) → F[( n −1) ,( n −1) ]
σ2 y
S2y x y

( n y −1) = σ 2y

Inferencia o inducción estadística

Es una parte de la estadística que se ocupa del estudio de la población a partir de una muestra

Los problemas fundamentales de la inferencia estadística son:

Estimación de parámetros

Pruebas de hipótesis

Estimación de parámetros

Es una función definida en una muestra que sirve de aproximación al parámetro poblacional

X es una estimación de la media poblacional µ


S2 es una estimación de la varianza poblacional σ2

Estimador:

Es una función definida por las estimaciones

Para que un estimador sea considerado como un buen estimador debe cumplir con las siguientes
propiedades:
Insesgamiento

Consistencia

Eficiencia

Suficiencia

Insesgamiento:

Sea X una variable aleatoria que se distribuye con parámetro ϴ

De esta población se selecciona aleatoriamente una muestra de tamaño n


^ ^
Sea θ un estimador del parámetro ϴ, decimos que θ es un estimador insesgado del
parámetro ϴ, si
^
E( θ ) = ϴ

Sea X  n(µ, σ2) seleccionamos una muestra aleatoria de tamaño n

Probar que
n
∑ xi
X = i =1
n
n
∑ ( x i−X )2
S 2 = i=1
n−1
Probar que

E( X) =µ

E(S2) = σ2

x 1 + x2 +.. .+ x n 1 1
E( X) =
E [ n ] = n
E [ x 1 +x 2 +. ..+x n ]
= n
[ E( x 1 )+ E( x 2)+. ..+Ex n )]
1 nμ
[ μ+ μ+. ..+ μ ] =μ
n = n

σ 2 ( n−1 )S2 σ2 2 σ
2
σ
2

E(S2) = E
( (n−1)σ 2 ) ( =E
(n−1)
χ ( n−1)
=
)
(n−1)
E( χ 2(n−1) )
= (n−1 )
(n−1)
= σ2

Consistencia
Sea X una variable aleatoria que se distribuye con parámetro ϴ

De esta población se selecciona aleatoriamente una muestra de tamaño n


^ ^
Sea θ un estimador del parámetro ϴ, decimos que θ es un estimador consistente del
parámetro ϴ, si

lim E( θ^ )=θ
n →∞

lim V ( θ^ )=0
n →∞

Sea X  n(µ, σ2) seleccionamos una muestra aleatoria de tamaño n

Probar que
n
∑ xi
X = i =1
n
n
∑ ( x i−X )2
S 2 = i=1
n−1
Son estimadores consistentes de la media y varianza poblacional

E( X) =µ

lim E( X )= lim μ=μ


n →∞ n →∞

2
lim σn = σ lim 1n
2
lim V ( X )
n →∞ = n →∞ n→∞ =0

2
( nx −1)S x
U= → χ (2n −1)
σ 2x x

Son estimadores insesgados de la media y varianza poblacional

X: edad de estudiantes mujeres 3º ciclo de estudiantes de la FIEECS

21 años, 21años, 19años, 20años


X = 20.25años/persona
nx

∑ xi
i =1
X=
nx

Población
V.A. :X
Parámetro:ϴ

Muestra Muestra Muestrak- Muetrak


1 2 1 θ^ k
θ^ 1 θ^ 2 θ^ k−1

X1 X2 xn X

Eficiencia

Sea X una variable aleatoria que se distribuye con parámetro ϴ y

^ θ^ 2 dos estimadores insesgados del parámetro Ɵ


Sean θ1 y

^ θ^ 2
Decimos que θ1 es más eficiente que
^ ^
V( θ1 ) < V( θ2 )

Eficiencia relativa

V ( θ^ 1 )
E= <0
V ( θ^ )
2

Sea X  n(µ, σ2)

Seleccionamos una muestra aleatoria y sean

X 1 +2 X 2 +3 X 3
μ^ 1 =
6
X 1+ X 2+ X 3
μ^ 2 =
3
Dos estimadores del parámetro µ

Cuál de estos estimadores es el mejor estimador

Hallar

X 1 +2 X 2 + 3 X 3
E(
μ^ 1 ) = E( 6 )= µ

X 1 +2 X 2 + 3 X 3
μ^
V(( 1 ) = V( 6 )= (7/18)σ2

X 1+ X 2+ X 3
E(
μ^ 2 ) = E( 3 )=µ

X 1+ X 2+ X 3
V(
μ^ 2 ) = V( 3 ) = (1/3)σ2

E = (7/18)/(1/3) = 7/6 > 0

Métodos de estimación puntual

Método de la máxima verosimilitud

Sea X una variable aleatoria que se distribuye con función de probabilidad f(x) y parámetro ϴ

Seleccionamos una muestra aleatoria de tamaño n

x1, x2, …, xn

donde f(x1, x2, …, xn) = f(x1)f(x2) …f(xn)


L función de verosimilitud

L = log[f(x1)f(x2) …f(xn)]

dL/dϴ = 0
^
resolviendo el sistema determinamos el estimador máximo θ del parámetro ϴ

sea X una variable aleatoria que se distribuye con función de probabilidad


−λ x
e λ
f (x )=
x!
Seleccionamos una muestra aleatoria de tamaño n x 1, x2, …, xn

f(x1, x2, …, xn) = f(x1)f(x2) …f(xn)


x1 x2 xn
e−λ λ e−λ λ e−λ λ
L= x1! x2 ! ….. xn !
x1 x2 xn
e−λ λ e−λ λ e−λ λ
Log(L) = log [ x 1 ! x2! ….. xn ! ]
n
∑ x1
e−nλ λ i=1
n

∏ xi !
= log[ i=1 ]

d Log(L)/dλ) = 0
n
∑ xi
i=1
^λ n X
= =

X: 0, 1, 2, …… que se distribuye con

e−λ λ x
f (x )=
x!
Sea X ϵ R que se distribuye con
2
1 x−μ

e
2 σ ( )
f (x )=
√ 2 πσ 2
Se selecciona una muestra aleatoria de tamaño n x 1, x2, …, xn determinar el estimador máximo
verosímil de los parámetros µ y σ2
n
∑ xi
i=1
μ^ = n = X
n
∑ ( x i− μ^ ) 2
i=1
σ^ 2 = n

Momento absoluto de orden r

Mr(X) = E[Xr]

Momentos reducidos de orden r

Mr(X - ot) = E[(X – ot)r]

Momento central de orden r

Mr(X - µ) = E[(X – µ)r]

Estimación por intervalo

Sea X una variable aleatoria que se distribuye con parámetro ϴ desconocido, seleccionamos una
muestra aleatoria de tamaño n

P ( θ^ 1 ≤θ≤ θ^ 2 )=γ

Donde

γ = coeficiente de confianza

(θ^ 1≤θ≤θ^ 2 ) = intervalo confidencial de la ocurrencia del pametro ϴ

θ^ 1 = Límite inferior confidencial

θ^ 2 = Límite superior confidencial


θ^ 2 - θ^ 1 longitud del intervalo confidencial

^ ^
( θ2 - θ1 )/2 = error muestral

Estimación por intervalo de la media poblacional

Sea X  n( µ, σ2) con media desconocida

Estimamos la media poblacional en los siguientes escenarios

La varianza pobalcional conocida

Sea X  n( µ, σ2) con media desconocida y varianza conocida, seleccionamos aleatoriamente una
muestra de tamaño n

σ2
X →n μ , ( ) n

Estandarizando X

X−μ
Z=
σ
√n  n(0,1)

P(a ≤ µ ≤ b) =ϒ

X −μ

(
P −z≤
σ
√n
≤z
) =ϒ

σ σ
(
P X −z
√n
≤μ≤ X + z
√n ) =ϒ

σ
X −z
a= √n
σ
X+z
b = √n
σ
z
e = (b-a)/2 = √n
σ
z
e= √n
2
σ
z2
n= e2

si la población es finita el tamaño de la muestra se afija a partir de la siguiente ecuación

no
n=
no
1+
N

Donde

no = tamaño de la muestra de una población infinita

N = tamaño de la población.

Los siguientes datos corresponden a las estaturas de una muestra aleatoria de estudiantes de la
FIEECS

162, 160, 174, 170, 165, 160, 167, 170, 167, 160, 167, 167, 167, suponiendo que las esturas se
distribuyen normalmente con varianza igual a 25, construir un intervalo del 95% de confianza para
estimar la verdadera estatura de los estudiantes de la FIEECS.

n = 13

ϒ = 0.95

σ=5

z = 1.95996398

X = 165.8461538
P(a ≤ µ ≤ b) =ϒ

σ
X −z
a= √n
a = 163.13

σ
X +z
b= √n
b = 168.56

P(163.13 ≤ µ ≤ 168.56) =0.95

Segundo escenario

Varianza poblacional desconocida

Estimamos puntualmente la varianza poblacional a partir de la varianza muestral


n
∑ ( x i−X )2
S 2 = i=1
n−1
Sea X  n(µ, σ2)

Donde la media y la varianza son desconocidas.

De esta población seleccionamos una muestra aleatoria de tamaño n suficientemente grande


(n>30)

Definimos

X−μ
T= →t ( n−1)
s
√n
P ( a≤μ≤b ) =γ

X −μ

(
P −t
( n−1)
1+γ
(2)

s
√n
≤t 1+ γ
(n−1) ( )
2 )=γ

(
P X −t
(
( n−1 )
1+γ
2
() √sn )≤μ≤X +t (
( n−1 )
1+γ
2
() √sn ))=γ
s
( )( )
X −t 1+γ
a=
( n−1)
2
√n

b=
X +t
(
( n−1)
1+γ
2
() √sn )
los siguientes datos corresponden a los pesos de una muestra de estudiantes de la FIEECS

65, 59, 74, 55, 65, 85, 73, 82, 53, 44, 65, 75,
75, 63, 60, 54, 64, 70, 65, 59, 74, 55, 65,
85, 73, 82, 53, 44, 65, 75, 75, 63, 60, 54, 64,
70

A partir de los datos construir un intervalo del 95% de confianza para estimar el peso medio de
todos los estudiantes de la FIEECS

n = 36

X = 65.1111
n
∑ ( x i−X )2
S 2 = i=1
n−1
S2 = 109.9587302

S = 10.48612083

Error típico 1.747686806

t(35)(0 .975)
= 2.03010793

Media 65.61111111

s
( )( )
X −t 1+γ
a=
( n−1)
2
√n
a = 65.61111111 - 2.03010793*1.747686806

a = 62.06311827

b=
X +t
(
( n−1)
1+γ
2
() √sn )
b = 65.61111111 + 2.03010793*1.747686806

b = 69.15910396

P(62.06311827 ≤ µ ≤ 69.15910396) = 0.95


Estimación por intervalo de la diferencia de medias poblacionales

Primer escenario varianzas poblacionales conocidas

Sean
2
X  n( μ x , σ x )

Y
n( μ y , σ 2y )

Seleccionamos muestras aleatorias de tamaño n x y ny respectivamente

P(a ≤ µx - µy ≤ b) = ϒ

σ 2x σ 2y
(
X −Y →n μ x −μ y , +
nx ny )
Estandarizando

( X −Y )−( μ x−μ y )
Z= →n( 0,1 )
σ 2x σ 2y
√ nx
+
ny

( X −Y )−( μ x −μ y )

(
P −z≤

√ σ 2x
+
nx ny
σ 2y
≤z =γ

)
σ 2x σ 2y σ 2x σ 2y
(
P ( X −Y )−z

+ ≤( μ x−μ y ) ≤( X −Y ) + z
nx n y
+
nx ny

√ )
σ 2x σ 2y
a=
( X −Y )−z +
nx n y √
2 2
σ σ
b=
( X −Y )+ z x + y
nx ny √
Estimación por intervalo de la diferencia de medias poblacionales

Primer caso
2 2
Varianzas desconocidas iguales (
σ x =σ y )

Sean X e Y dos variables aleatorias normalmente distribuidas con varianzas poblacionales


desconocidas iguales, esto es:
2
X →n( μ x , σ x )

Y →n( μ y , σ 2y )
Seleccionamos muestras aleatorias de tamaño n x, ny respectivamente
nx nx ny ny

∑ xi ∑ ( x i −X ) 2
∑ yi ∑ ( y i −Y )2
i =1 2 i=1 i=1 2 i=1
X= S x= Y= S y=
nx , nx −1 ny , n y −1

El intervalo de confianza del ϒ% será:

P(a ≤ µx - µy ≤ b) = ϒ

Será siempre que

a=

b=

Construimos el estadístico

( X−Y )−( μ x −μ y )
(n x −1)S 2x +(n y−1 )S 2y 1 1

T= √ n x + n y −2
+
nx n y ( ) 
t( n +n −2)
x y
( X −Y )−( μ x −μ y )

P
[ −t
( nx +n y −2 )
1+γ
(2)


2
(n x −1)S +(n y −1)S 1 1
n x +n y −2
x
+
nx n y
2
y
( )
¿t
(n +n −2)
x y ( 1+γ2 )
] =ϒ

( n x −1 ) S2x +( n y −1 ) S 2y 1 1 ( n x −1 )S2x +( n y −1)S 2y 1 1

P [ ( X−Y )−t
(n x +n y −2) ( 1+γ
2 )√ n x + n y −2 ( +
nx ny)¿( μx −μ y )≤( X −Y )+t

(nx +n y −2) ( 1 +γ )
2
nx +n y −2 ( +
nx ny )] =ϒ

2 2
(n x −1) S x +( n y −1 )S y 1 1

a=
( X−Y )−t
(n x +n y −2) ( 1+2 γ ) √ n x +n y −2
+
nx n y ( )
(n x −1)S 2x +(n y −1)S 2y 1 1
)√ ( )
( X−Y )+t +
b=
( n x +n y −2) ( 1+γ2 n x +n y −2 nx n y

2 2
2º caso varianzas poblacionales desconocidas diferentes(
σ x ≠σ y )

Sean X e Y dos variables aleatorias normalmente distribuidas con varianzas poblacionales


desconocidas diferentes, esto es:
2
X →n( μ x , σ x )

Y →n( μ y , σ 2y )
Seleccionamos muestras aleatorias de tamaño n x y ny respectivamente

X - Y : diferencia de medias muestrales se distribuye con

( X−Y )−( μ x−μ y )


T= →t ( g )
2 2
Sx Sy
√ nx
+
ny
2
S 2x S 2y

g=
( +
nx n y ) −2
2 2
S2x S 2y
( ) ( )
nx
+
ny
n x−1 n y −1

( X −Y )−( μ x−μ y )

P
[ −t
(g)
1+γ
(2)

√ S 2x
+
nx ny
S2y
≤t
(g ) ( 1+γ2 )
] =ϒ

S 2x S 2y S2x S 2y
[
P ( X −Y )−t
(g) ( 1+γ2 ) √ +
nx n y
≤( μ x −μ y )≤( X −Y )+t 1+γ
( g) (
+
) nx n y
2
√ ]
2 2
Sx S y
)√
( X−Y )−t +
a=
( g) ( 1+γ2 nx n y

S 2x S2y
)√
( X−Y )+t +
b=
(g ) ( 1+γ2 nx ny

con el objeto de comparar las edades de estudiantes varones y mujeres de le FIEECS

se seleccionó muestras aleatorias de tamaño n x y ny respectivamente

X: edad de estudiantes varones de la FIEECS

Y: edad de estudiantes mujeres de la FIEECS

Suponiendo que las edades se distribuyen normalmente


2
X n( μ x , σ x )

Y n(
μ y ,σ 2y )

Construir un intervalo del 95% de confianza para estimar la diferencia de edades medias de
estudiantes varones y mujeres de la FIEECS

X: 20, 19, 19, 20, 21


Y: 21, 19, 21, 19,

1º paso contrastar las varianzas poblacionales

 Formular las hipótesis estadísticas


2 2
H o :σ x =σ y
2 2
H o :σ x ≠σ y
 Elegir la prueba estadística

Prueba F

 Nivel de significancia α = 0.05


 Grados de libertad: (4, 3)
 Puntos críticos

0.100208448, 15.10097893

 Función pivotal

S 2x
F o=
S2y = 0.5250013125

 Toma de decisiones

Como Fo = 0.5250013125 pertenece a la región de aceptación bajo la hipotecis nula

Aceptamos la hipótesis nula y rechazamos la hipótesis alternativa

 Elaboración de conclusiones: concluimos diciendo que las varianzas poblacionales son


iguales con una significancia del 5%

nx

∑ xi
i =1
X=
nx = 19.8
ny

∑ yi
i=1
Y=
ny = 20
nx

∑ ( x i −X )2
2 i=1
S x=
nx −1 = 0.7
ny

∑ ( y i −Y )2
i=1
S 2y =
n y −1 = 1.33333

Construir un intervalo de confianza del 95% para estimar la diferencia de medias poblacionales
provenientes de poblaciones normales con varianzas desconocidas iguales.

P(a ≤ µx - µy ≤ b) = 0.95

Donde:

(n x −1) S2x +( n y −1 )S2y 1 1

a=
( X−Y )−t
(n x +n y −2) ( 1+2 γ ) √ n x +n y −2 ( +
nx n y )
2 2
(n x −1) S x +(n y −1) S y 1 1
)√ ( )
( X−Y )+t +
b=
( n x +n y −2) ( 1+γ2 n x +n y −2 nx n y

t(7,0.975) = 2.364624252

a = -1.763413398

b = 1.363413398

P (-1.763413398 ≤ µx - µy ≤ 1.363413398) = 0.95

Estimación por intervalo de la proporción poblacioanal

Sea X una variable aleatoria que se distribuye con proporción poblacional P desconocida,
seleccionamos una muestra aleatoria de tamaño n

Estimamos puntualmente la proporción poblacional a partir de la proporción muestral p y

Si Si n < 30

Construimos el estadístico

p−P
T= →t ( n−1)
pq
√ n
De donde podemos decir que
p−P

(
P −t 1+γ ≤
(n−1)( )
2
√ pq
n
≤t
(n−1 )(
1+γ
2
)
) =ϒ

pq pq
(
P p−t
(n−1)(
1+γ
2
) √ n
≤P≤ p+ t
(n−1)(
1+γ
2
) n √ ) =ϒ

De una muestra de 20 estudiantes de la FIEECS se encontró 15 varones, a partir de la siguiente


información construir un intervalo del 95% de confianza para estimar la proporción de todos los
estudiantes de la FIEECS.

n = 20

p = 0.75

q = 0.25

t(19, 0.975) = 2.093024054

pq
a=
p−t
(n−1)(
1+γ
2
) √ n
= 0.547343817

pq
b=
p+t
( n−1)(
1+γ
2
) √ n
= 0.9526561826

P(0.547343817 ≤ P ≤ 0.9526561826) = 0.95

Si n ≥ 30 por el Teorema central del límite p se distribuye aproximadamente normal con E(p) = P y
varianza PQ/n

Como P no es conocido estimamos puntualmente a partir de la proporción muestral p

Luego estandarizamos

p−P
z= →n(0,1)
pq
√ n

p−P

(
P −z≤

√pq
n
≤z =γ
)
( √ pqn ≤P≤p + z √ pqn )=γ
P p−z

pq
e=
z
√ n

z 2 pq
n=
e2
Si la muestra es finita afijamos proporcionalmente

n
n=
n
1+
N
Determinamos la muestra optima haciendo p = q = .5

Determinar el tamaño de la muestra optima con una confianza

ϒ = 0,95

Z = 1.95996398

Error de muestreo de e = 0.05

p = q = 0.5

z 2 pq
n=
e2
n = 384

Error de muestreo de e = 0.10

p = q = 0.5

z 2 pq
n= 2
e
n = 96

Estimación por intervalo de la diferencia de proporciones poblacionales (P x – Py)

Sea X e Y dos variables aleatorias que se distribuyen con P x y Py proporciones poblacionales


respectivamente desconocidas
Seleccionamos aleatoriamente muestras de tamaño n x y ny respectivamente, estimamos
puntualmente Px y Py, luego decimos que

px – py se distribuye con E(px –py) = Px – Py y V[(pxqx/nx)+( pyqy/nx)]

si nx + ny < 30

( p x − p y )−( P x−P y )
T= →t ( n +n
y −2 )
px q x py qy x

√ nx
+
ny
si nx + ny < 30

px qx py qy px qx p y q y
(
P ( p x −p y )−t 1+γ
( )
( n x +n y −2)
2
√ nx
+
ny
¿=P x −P y ¿( px − p y )+t
(n + n −2)
x y √
1 +γ
( 2 ) nx
+
ny ) =γ

P(a ≤ Px – Py ≤ b) =ϒ

px qx py q y

a=
( p x − p y )−t
( )
( nx +n y −2 )
1+γ
2
√ nx
+
ny

px qx p y qy
)√
( p x − p y )+t 1+γ
+
(
( n x +n y −2) nx ny
b= 2

Si nx + ny > 30

( p x− p y )−( P x−P y )
z= →n( 0,1 )
px qx p y q y
√ nx
+
ny

( p x −p y )−(P x −P y )

(
P −z≤

√ px qx p y q y
nx
+
ny )
≤z =γ

px qx p y q y px qx py qy
(
P ( p x −p y )−z
√ nx
+
ny
≤¿ P x−P y≤( p x − p y )+ z
nx
+
ny √=γ
)
P(a ≤ Px – Py ≤ b) =ϒ
px qx p y q y
a=
( p x − p y )−z
√ nx
+
ny

px qx p y q y
b=
( p x − p y )+z
√ nx
+
ny

en una muestra de 25 varones y 25 mujeres se encontró que el 20% de mujeres y el 30% de


varones estudiantes de la FIEECS son estudiantes provenientes provincias

a partir de la siguiente información construir un intervalo del 95% de confianza para estimar la
diferencia de estudiantes provenientes de provincias

X: estudiantes varones

Y: estudiantes mujeres

nx = 25

ny = 25

px = 0.30 qx = 0.70

py = 0.20 qy = 0.80

P(a ≤ Px – Py ≤ b) =ϒ

px qx p y q y px qx py qy
(
P ( p x −p y )−z
√ nx
+
ny √
≤¿ P x−P y≤( p x − p y )+ z
nx
+
ny ) =γ

px qx p y q y
a=
( p x − p y )−z
√ nx
+
ny = - 0.13843991

px qx p y q y
b=
( p x − p y )+z
√ nx
+
ny = 0.33843991

P(- 0.13843991 ≤ Px – Py ≤ 0.33843991) = 0.95

Estimación por intervalo de la Varianza poblacional

Sea X  n(µ,σ2) donde los parámetros µ y σ2 son desconocidos

Estimamos puntualmente a partir de


n
∑ xi
X = i =1
n
n
∑ ( x i−X )2
S 2 = i=1
n−1
Sea el estadístico
2
( n−1) S
U= 2
→ χ 2(n−1)
σ
P(a ≤ σ2 ≤ b) = ϒ

(n−1) S2
P χ
( 2
( n−1) ( 1−γ2 )

σ 2
≤χ
2
( n−1 ) (
1+γ
2
))

( n−1) S2 2 (n−1)S 2
P 2
χ
( 1+γ
≤σ ≤ 2
( n−1)
χ 1−γ
(2)

(n−1) (2) )
Donde

(n−1)S 2
χ2 1+γ
a=
( n−1 ) (2)
2
(n−1)S
χ 2 1−γ
b=
( n−1 ) (2)
los siguientes datos corresponden a las estaturas de una muestra de estudiantes de la FIEECS

165, 167, 162, 174, 170, 160, 166, 165, 165, 171, 168, 170, 165, 168, 167, 170, 154, 150, 154

A partir de los siguientes datos construir un intervalo de confianza del 95% para estimar la
estatura media y la varianza de todos los estudiantes de la FIEECS.

Estimamos puntualmente
n
∑ xi
X = i =1
n = 164.7894737
n
∑ ( x i−X )2
S 2 = i=1
n−1 = 39.95321637

t(18,0.975) = 2.10092204
n = 19

P(a ≤ µ ≤ b) = 0.95

a=
X −t
( n−1)
1+γ
2 ( () √sn ) = 161.7429188

b=
X +t
( n−1)
1+γ
2 ( () √sn ) = 167.8360286

P( 161.7429188 ≤ µ ≤ 167.8360286 ) = 0.95

P(a ≤ σ2 ≤ b) = 0.95
2
χ (18 )(0.025) = 8.230746195

χ 2(18)(0.975) = 31.52637844

( n−1) S2 2 (n−1)S 2
P 2
χ
(1+γ
≤σ ≤ 2
χ
( n−1)
1−γ

(2) (n−1) (2) )
2
(n−1)S
χ2 1+γ
a=
( n−1 ) (2) = 22.81130692

2
(n−1)S
χ 2 1−γ
b=
( n−1 ) (2) = 87.3745682

P(22.81130692 ≤ σ2 ≤ 87.3745682) = 0.95

Estimación por intervalo de la Razón de varianzas poblacionales.

Sean
2
X →n( μ x , σ x )
2
Y →n( μ y , σ y )
Donde sus medias y sus varianzas son desconocidas, Seleccionamos aleatoriamente muestras de
tamaño nx y ny respectivamente, estimamos puntualmente

Estimamos puntualmente a partir de


nx nx

∑ xi ∑ ( x i −X )2
i =1 i=1
X= S 2x=
nx , nx −1
ny ny

∑ yi ∑ ( y i −Y )2
i=1 i=1
Y= S 2y =
ny , n y −1

Construimos el estadístico

2 2
Sx Sx
2
σ 2x Sy
F= → F[( n −1) ,( n −1) ] F= 2
→ F[( n −1) ,( n −1) ]
S2y x y
σx x y

σ 2y σ 2y

S2x

P F
( [( n x −1), (n y −1) ] ( 1−γ2 )

S 2y
σ 2x
σ 2y
¿F
[(n x −1),( n y −1)] ( 1+2 γ )
) =ϒ

S 2x Sx
2

P
( F
S2y

[(n x −1) ,( n y −1 )] ( 1+γ2 )



σx
2

2
¿
σ y F [(n
x
Sy
2

−1),( n y −1)] ( 1−γ2 ) ) =ϒ

Con el objeto de comparar las medias y varianzas de los pesos de estudiantes varones y mujeres
de todos los estudiantes de la FIEECS.

Se selecciona una muestra de estudiantes varones y mujeres de la FIECCS

X = peso de estudiantes varones

Y = peso de estudiantes mujeres


X: 74, 82, 74, 63, 65, 70, 75, 62

Y: 59, 54, 50, 55, 45

A partir de los datos obtenidos construir un intervalo del 95% de confianza para estimar la
diferencia de medias y la razón de varianzas poblacionales.

Solución

Estimamos puntualmente a partir de


nx

∑ xi
i =1
X=
nx = 70,6250
nx

∑ ( x i −X )2
i=1
S 2x=
nx −1 = 47,98208215
ny

∑ yi
i=1
Y=
ny = 52,6000

ny

∑ ( y i −Y )2
i=1
S 2y =
n y −1 = 28,29995285

Primero
Contrastar las varianzas poblacionales
2 2
H o :σ x =σ y
H 1 :σ 2x≠σ 2y
Prueba estadística: prueba F
Nivel de significancia: α = 0.05
Puntos críticos:
F(7,4)(0.025) = 0.18107432
F(7,4)(0.975) = 9.07414105
Función pivotal
S 2x
F o= 2
Sy = 1.695482759
Toma de decisiones
Como Fo pertenece a la región de aceptación bajo la hipótesis nula aceptamos la hipótesis nula y
rechazamos la hipótesis alternativa
Elaboración de conclusiones
Concluimos diciendo que las varianzas poblacionales son iguales
Resúmenes
nx = 8
ny = 5
X = 70,6250
2
S x = 47,98208215

Y = 52,6000
2
S y = 28,29995285
F(7,4)(0.025) = 0.18107432
F(7,4)(0.975) = 9.07414105
t(11,0.975) = 2.20098516
X - Y = 18.025

(n x−1 )S2x +( n y −1)S 2y 1 1


√ n x +n y−2
+
nx ny ( ) = 3.64254
Intervalo de confianza de la diferencia de medias poblacionales
P(a ≤ µx - µy ≤ b) = 0.95

Donde:

(n x −1) S2x +( n y −1 )S2y 1 1

a=
( X−Y )−t
(n x +n y −2) ( 1+2 γ ) √ n x +n y −2 ( +
nx n y )
(n x −1)S 2x +(n y −1)S 2y 1 1
)√ ( )
( X−Y )+t +
b=
( n x +n y −2) ( 1+γ2 n x +n y −2 nx n y

a = 10.00782352
b = 26.04217648
P(10.00782352 ≤ µx - µy ≤ 26.04217648) = 0.95

Intervalo de confianza de la razón de varianzas poblacionales

σ 2x
P a≤
( σ 2y
≤b =γ
)
S 2x Sx
2

P
( F
S2y

[(n x −1) ,( n y −1 )]
1+γ
2 ( )

σ 2x
¿
σ 2y F
S2y

[(n x −1),( n y −1)] ( 1−γ2 ) )


S 2x
S 2y = 1.695482759

S 2x
2
Sy
F
a=
[(n x −1) ,(n y −1 )] ( 1+γ2 )
2
Sx
2
Sy
F
b=
[(n x −1) ,( n y −1 )] ( 1−γ2 )
a = 0.1868477413

b = 9.363463353

σ 2x
(
P 0 . 1868477413≤
σ 2y
≤9 .363463353 =0. 95
)
La oficina de transportes del municipio de Lima afirma que el parque automotor de servicio
público tiene una antigüedad promedio de 10 años. Para comprobar esta aseveración, se
escogen al azar 400 unidades que circulan por la ciudad y se registra el número de años que
están operando cada una de ellas. Se obtuvo los siguientes datos:
∑ x i = 5000 ∑ x 2i = 72500

Además, se observó 80 unidades con una antigüedad mayor a 18 años

a) Calculando los límites de confianza del 95%, ¿encuentra apoyo la afirmación de la


oficina de transportes?
b) Estime con 98% de confianza la proporción de unidades con antigüedad no mayor a 18
años. Interprete su resultado.
Datos

∑ xi = 5000
∑ x2i = 72500
n = 400
X = 12.5
S 2 = 25.06265664
S = 5.006261743
t(399,0.975) = 1.965927296
P(a ≤ µ ≤ b) = 0.95

a=
X −t
(
( n−1)
1+γ
2
() √sn ) = 10.0104446

b=
X +t
(
( n−1)
1+γ
2
() √sn ) = 14.9895554

P(10.0104446 ≤ µ ≤ 14.9895554) = 0.95


Además, se observó 80 unidades con una antigüedad mayor a 18 años
Estime con 98% de confianza la proporción de unidades con antigüedad no mayor a 18
años. Interprete su resultado
n = 400
p = 0.8
q = 0.2
ϒ = 0.98
t(399,0.985) = 2.335729959
P(a ≤ P ≤ b) = 0.98
a = 0.753473043
b = 0.846526957
P(0.753473043 ≤ P ≤ 0.846526957) = 0.98

Cierta empresa comercial desea invertir en alguno de los tipos de Acciones A ó B. Para
tomar una decisión acertada, elige dos muestras independientes, una de cada tipo de acción,
y evalúa el nivel de rentabilidad mensual (en dólares). Se sabe que dichas acciones tienen
una rentabilidad mensual que se comporta según una distribución normal. Los resultados
muestrales obtenidos se dan en la siguiente tabla:

Tamaño de Promedio de
Varianza
muestra rentabilidad
Acciones
11 8950 dólares 120978.752 dólares2
tipo A
Acciones
16 6430 dólares 25249.21 dólares2
tipo B
Utilizando intervalos de confianza responda las siguientes preguntas.

a) Para decidir qué tipo de acción elegir se tendrá como condición prioritaria el riesgo que
implica la inversión en cada tipo de acción. Con un nivel de confianza de 95%, ¿se
puede afirmar que las acciones tipo B tienen menos riesgo que las acciones tipo A?
b) El Gerente Administrativo considera que, bajo las condiciones actuales del mercado
bursátil, se debe tener muy en cuenta el nivel de rentabilidad promedio de estas
acciones, y que prefiere invertir en las acciones tipo B, a menos que se tenga evidencias
razonables que indiquen que invertir en las acciones tipo A es más rentable. Utilizando
un nivel de confianza del 95%, decida en qué tipo de acción debe invertir el gerente de
la empresa.

Contrastar las varianzas poblacionales


2 2
H o :σ A =σ B
2 2
H 1 :σ A ≠σ B
Prueba estadística: prueba F
Nivel de significancia: α = 0.05
Puntos críticos:
F(10,15)(0.025) = 0.28395593
F(10,15)(0.975) = 3.060196851

Función pivotal
S2A
F o=
S 2B = 4.791386542
Toma de decisiones
Como Fo pertenece a la región de critica bajo la hipótesis nula aceptamos la hipótesis alternativa y
rechazamos la hipótesis nula
Elaboración de conclusiones
Concluimos diciendo que las varianzas poblacionales son diferentes, esto es la varianza de A es
mayor que la varianza de B
2
σA

P(a ≤ σ 2B ≤ b) = 0.95

a = 1.565711873
b = 19.87369777
σ 2A
2
P(1.565711873 ≤ σ B ≤ 19.87369777) = 0.95
El Gerente Administrativo considera que, bajo las condiciones actuales del mercado
bursátil, se debe tener muy en cuenta el nivel de rentabilidad promedio de estas acciones, y
que prefiere invertir en las acciones tipo B, a menos que se tenga evidencias razonables que
indiquen que invertir en las acciones tipo A es más rentable. Utilizando un nivel de
confianza del 95%, decida en qué tipo de acción debe invertir el gerente de la empresa.
P(a ≤ µA - µB ≤ b) = 0.95

2
S 2A S 2B

g=
( nA
+
nB )
2 2 2 2
SA SB
( ) ( )
nA
+
nB
n A −1 nB −1
g = 13
t(13,0.975) = 2.160368656

S2A S 2B
√ +
nA nB = 112.1434081

S2A S 2B
t(13,0.975) √ +
nA nB = 242.2711038

X A −X B = 2520
a = 2277.728896
b = 2762.271104
P(2277.728896 ≤ µA - µB ≤ 2762.271104) = 0.95

Dos de las más grandes tiendas por departamentos, R y S, compiten por captar la mayor
proporción del mercado. Recientemente una Cía. de investigación de mercados ha dado a
conocer que R tiene una preferencia del 40% del mercado local mientras que S capta sólo el
30%. Se ha considerado muestrear a 100 personas de cada uno de los mencionados
establecimientos, preguntándoles acerca de su mayor preferencia por R o S
a) ¿Cuál es la probabilidad de que la proporción de las preferencias en ambas muestras
difieran en menos del 5%?
b) ¿Entre qué límites se encuentra la diferencia de las proporciones muestrales sobre la
preferencia a los dos establecimientos, si se desea que dichos límites contengan el 95%
de los casos?
E(pR – pS) = 0.10
V(pR – pS) = 0.0045

P(│pR – pS│< 0.05) = P(pR – pS < 0.05) - P(pR – pS < - 0.05)


= 0.22802827 - 0.012673659
= 0.215354611
P(a ≤ PR – PS ≤ b) = 0.95
a = - 0.03148
b = 0.231478

Pruebas de hipótesis estadísticas


Hipótesis: es una proposición que puede ser falsa o verdadera cuya validez debe ser comprobada
Hipótesis estadística: es una hipótesis que se formula a cerca de la distribución de una valriable
aleatoria.
Estadísticamente se formulan dos hipótesis
Hipótesis nula: Ho se formula con el objetivo de eliminar
Hipótesis alternativa: H1 se formula con el objetivo de aceptar como verdadera

Ho H1

RA/Ho Punto critico RR/Ho

Error tipo I consiste en rechazar algo que se considera como verdadero


P(Error tipo I ) = α
Error tipo II consiste en aceptar algo que se considera como no verdadero
P(Error tipo II ) = β
Función potencia: P = 1 – β
Tabla de decisiones

Ho Verdadero H1 Verdadero
Aceptar Ho Decisión correcta Error tipo I
Aceptar H1 Error tipo II Decisión correcta

El centro médico de la UNI afirma que el peso medio de los estudiantes de la UNI es considerado
como una variable aleatoria normalmente distribuida con media 65 kg y varianza 25 kg 2 así mismo
la representación estudiantil afirma que el peso medio de los estudiantes de la UNI es considerado
como una variable aleatoria normalmente distribuida con media 60 kg y varianza 36 kg 2
Para contrastar estas afirmaciones se selecciona una muestra aleatoria de 25 estudiantes si la
media de la muestra es superior a 64 kg. Se acepta la afirmación del centro médico en caso
contrario se acepta la afirmación de la representación estudiantil.
Calcular la probabilidad de cometer el error tipo I y tipo II
Hipótesis estadísticas
Ho: µ = 60
H1: µ = 65

Sea X  n(60, 25) distribución de los pesos según la afirmación de la representación estudiantil
Probabilidad de cometer el error tipo (α)
X n(60, 1)

α = P( X ≥ 64) = 0.00004
Sea X  n(65, 36) distribución de los pesos según la afirmación del centro medico
Probabilidad de cometer el error tipo (β)
X n(65,36/25)

β = P( X ≤ 64) = 0.202328381
P = 0.797671619
Pruebas de hipótesis paramétricas
Sobre la media poblacional
Varianza poblacional es conocida
Varianza poblacional es desconocida
Sobre la diferencia de medias poblacionales
Varianzas poblacionales conocidas
Varianzas poblacionales desconocidas
Varianzas poblacionales desconocidas iguales
Varianzas poblacionales desconocidas diferentes
Sobre la proporción poblacional
Sobre la diferencia de proporciones poblacionales
Sobre la varianza poblacional
Sobre la razón de varianza poblacionales

El examen parcial hasta


Prueba de hipótesis sobre la media poblacional
Varianza poblacional es conocida
Varianza poblacional es desconocida

Prueba de hipótesis sobre la media poblacional:


Primer escenario: Varianza poblacional conocida
Pasos para contrastar las hipótesis:
 Formulación de hipótesis estadísticas
Ho: µ = µo
H1: µ ≠ µo
H1: µ < µo
H1: µ > µo
 Prueba estadística: prueba z
 Nivel de significancia: α
 Puntos críticos
Prueba bilateral ± z
Prueba unilateral –z, z
 Función pivotal
X−μ o
z o=
σ
√n
Toma de decisiones
Elaboración de conclusiones

Segundo escenario: Varianza poblacional desconocida


Estimamos puntualmente la varianza poblacional a partir de
n
∑ ( x i−X )2
S 2 = i=1
n−1
Pasos para contrastar las hipótesis:
 Formulación de hipótesis estadísticas
Ho: µ = µo
H1: µ ≠ µo
H1: µ < µo
H1: µ > µo
 Prueba estadística: prueba t
 Nivel de significancia: α
 Grados de libertad: n-1
 Puntos críticos
t α
( n−1)( 1− )
Prueba bilateral ± 2

t(n−1)(α) t(n−1)(1−α )
Prueba unilateral: ,
 Función pivotal
X−μo
t o=
s
√n
Toma de decisiones
Elaboración de conclusiones

El jefe de servicio al cliente de la cadena de restaurantes Bembosa afirma que el tiempo de


espera de los clientes tiene una media de 5 minutos con una desviación estándar de 1
minuto. El departamento de control de la calidad encontró, en una muestra aleatoria de 50
clientes realizada en el Bembosa del Honey Plaza, que el tiempo medio de espera fue de
4.25 minutos. Con un nivel de significación 0.05, ¿es posible concluir que el tiempo medio
de espera es menor de 5 minutos? Asuma que el tiempo de espera de los clientes tiene
distribución Normal.
Formulación de hipótesis estadísticas
Ho: µ = 5
H1: µ < 5
Prueba estadística: prueba z
Nivel de significancia: α = 0.05
Punto crítico: -z = -1.644853627
X−μ o
z o=
σ
Función pivotal: √n
X = 4.25
μo =5
σ=1
n = 50
zo = -5.30
zo = -5.30 pertenece a la región critica
decisión: como zo = -5.30 pertenece a la región critica aceptamos la hipótesis alternativa y
rechazamos la hipótesis nula
conclusión: concluimos diciendo que el tiempo medio de espera es menos de cinco minutos con una
significancia del 5%

El jefe de ventas afirma que las cajas de cierto tipo de cereal, procesados por la fábrica
G&S deben tener un contenido promedio de 160 gr. Por una queja ante el defensor del
consumidor de que tales cajas de cereal tienen menos contenido, un inspector tomó una
muestra aleatoria de 10 cajas encontrando los siguientes pesos de cereal en gramos:
157 157 163 158 161 159 162 159 158 156
¿Es razonable que el inspector multe al fabricante? Utilice un nivel de significación del 4%
y suponga que los contenidos tienen distribución normal.
Formulación de hipótesis estadísticas
Ho: µ = 160
H1: µ < 160
Prueba estadística: prueba t
Nivel de significancia: α = 0.04
Punto crítico: -1.972652652
X−μo
t o=
S
Función pivotal: √n
X = 159
μo = 160
S = 2.309401077
n = 10
to = -1.369306394
to = -1.369306394 pertenece a la región de aceptación bajo la hipótesis nula
decisión: como to = -1.369306394 pertenece a la región de aceptación bajo la hipótesis nula
aceptamos la hipótesis nula y rechazamos la hipótesis alternativa
Conclusión: concluimos diciendo que no existen razones suficientes para que el inspector aplique
la multa.

Muestras independientes
Prueba de hipótesis sobre la diferencia de medias poblacionales provenientes de poblaciones
normales con varianzas poblacionales conocidas.
Formulación de hipótesis estadísticas
Ho: µx = µy
H1: µx ≠ µy
H1: µx < µy
H1: µx > µy
Prueba estadística: Prueba z
Nivel de significancia: α
Puntos críticos: ± z
-z
z
X −Y
z o=
σ 2x σ 2y
Función pivotal: √ +
nx n y

Decisión:
Conclusión:

Prueba de hipótesis sobre la diferencia de medias poblacionales provenientes de poblaciones


normales con varianzas poblacionales desconocidas iguales
Formulación de hipótesis estadísticas
Ho: µx = µy
H1: µx ≠ µy
H1: µx < µy
H1: µx > µy
Prueba estadística: Prueba t
Nivel de significancia: α
t α
( n x+n y −2)(1− )
Puntos críticos: ± 2

t(n +n −2)(1−α)
- x y

t( n +n −2)(1−α)
x y

X−Y
t o=
(n x−1)S 2x +(n y−1 )S2y 1 1

Función pivotal: √ n x +n y −2 ( +
nx n y )
Decisión:
Conclusión:
Prueba de hipótesis sobre la diferencia de medias poblacionales provenientes de poblaciones
normales con varianzas poblacionales desconocidas diferentes
Formulación de hipótesis estadísticas
Ho: µx = µy
H1: µx ≠ µy
H1: µx < µy
H1: µx > µy
Prueba estadística: Prueba t
Nivel de significancia: α
t α
(g )(1− )
Puntos críticos: ± 2

t
- (g )(1−α)
t(g )(1−α)
X−Y
t o=
2 2

Función pivotal: √( Sx S y
+
nx n y )
Decisión:
Conclusión:

Una empresa grande de corretaje de acciones desea determinar qué tanto éxito han tenido sus
nuevos ejecutivos de cuenta en la consecución de clientes. Después de terminar su capacitación,
los nuevos ejecutivos pasan varias semanas haciendo llamadas a posibles clientes, tratando de que
los prospectos abran cuentas con la empresa. Los datos siguientes dan el número de cuentas
nuevas abiertas durante las primeras dos semanas por 10 ejecutivas y 8 ejecutivos de cuenta
escogidos aleatoriamente. A un nivel de α = 0.05, ¿parece que las mujeres son más efectivas que
los hombres para conseguir nuevas cuentas?

Número de cuentas nuevas


Mujeres(X) 12 11 14 13 13 14 13 12 14 12
Hombres(Y) 13 10 11 12 13 12 10 12
nx = 10
ny = 8
X = 12.8
Y = 11.625
2
S x = 1.066666
2
S y = 1.410714286
Formulación de hipótesis estadísticas

Ho:
σ 2x =σ 2y

H1:
σ 2x ≠σ 2y
Prueba estadística: Prueba F
Nivel de significancia: α = 0.05
Puntos críticos:
F(9,7)(0.025) = 0.23826278
F(9,7)( 0.975) = 4.823217085

S 2x
F o=
Function pivotal: S2y = 0.756118143

Fo = 0.756118143 pertenece a la región de aceptación bajo la hipótesis nula


Decisión: como Fo = 0.756118143 pertenece a la región de aceptación bajo la hipótesis nula
Aceptamos la hipótesis nula y rechazamos la hipótesis alternativa
Conclusión: concluimos diciendo que las varianzas poblacionales desconocidas son iguales.
Formulación de hipótesis estadísticas
Ho: µx = µy
H1: µx > µy
Prueba estadística: Prueba t
Nivel de significancia: α = 0.05
t( n +n −2)(1−α)
Puntos críticos: x y = t(16)(0.95) = 1.745883676
X−Y
t o=
(n x−1)S 2x +(n y−1 )S2y 1 1

Función pivotal: √ n x +n y −2 (
+
nx n y ) = 2.24526634
to = 2.24526634 pertenece a la región critica o región de rechazo bajo la hipótesis nula
Decisión: como to = 2.24526634 pertenece a la región critica o región de rechazo bajo la hipótesis
nula, aceptamos la hipótesis alternativa y rechazamos la hipótesis nula
Conclusión: concluimos diciendo que las mujeres son más efectivas que los hombres para
conseguir nuevas cuentas

Una compañía está tratando de decidir cuál de los dos tipos de neumáticos va a comprar. En
el directorio existe la expectativa de comprar los neumáticos de la marca A, a menos que
haya alguna evidencia de que la marca B resulte mejor. Se hizo un experimento en el que se
usó 14 neumáticos de cada marca. La prueba fue bajo condiciones semejantes y se
determinó el recorrido (en kilómetros) hasta que se desgasten totalmente. Los resultados
fueron:
Recorrido Desviación
Marca
Promedio Estándar
B 35000. 4200
A 32000 2800

Considerando que los recorridos de cada una de las marcas de neumáticos tienen
distribución normal, ¿Qué marca de neumáticos se decidirá comprar la compañía? Utilizar
un nivel de significancia = 0.01

Formulación de hipótesis estadísticas


2 2
Ho:
σ x =σ y
2 2
H1:
σ x ≠σ y
Prueba estadística: Prueba F
Nivel de significancia: α = 0.01
Puntos críticos:
F(13,13)(0.005) = 0.218661503
F(13,13)( 0.995) = 4.573278721

S 2x
F o=
Function pivotal: S2y = 2.24526634
Fo = 2.25 pertenece a la región de aceptación bajo la hipótesis nula
Decisión: como Fo = 2.24526634 pertenece a la región de aceptación bajo la hipótesis nula
Aceptamos la hipótesis nula y rechazamos la hipótesis alternativa
Conclusión: concluimos diciendo que las varianzas poblacionales desconocidas son iguales.

Formulación de hipótesis estadísticas


Ho: µx = µy
H1: µx > µy
Prueba estadística: Prueba t
Nivel de significancia: α = 0.05
t( n +n −2)(1−α)
Puntos críticos: x y = t(26)(0.99) = 2.478629824
X−Y
t o=
(n x−1)S 2x +(n y−1 )S2y 1 1

Función pivotal: √ n x +n y −2 (
+
nx n y ) = 2.22374795
to = pertenece a la región critica o región de aceptacion bajo la hipótesis nula
Decisión: como to = 2.22374795pertenece a la región de aceptación bajo la hipótesis nula,
aceptamos la hipótesis nula y rechazamos la hipótesis alternativa
Conclusión: concluimos diciendo que se debe comprar los neumáticos de la marca A

Prueba de hipótesis sobre la diferencia de medias para datos pareados


sean X e Y dos variables aleatorias dependientes esto es los datos se presentan en pares
ordenados definimos d = X – Y diferencia de las datos pareados.
Formulación de hipótesis estadísticas
Ho: d = 0
H1: d ≠ 0
H1: d < 0
H1: d > 0
Prueba estadística: prueba t
Nivel de significancia: α
Grados de libertad: n-1
Puntos críticos
±t(n-1)(1-α/2)
-t(n-1)(1-α/2)
t(n-1)(1-α/2)
d
t o=
2
Sd
función pivotal √ n
Toma de decisiones
Elaboración de conclusiones

Los siguientes datos corresponden a los tiempos empleados antes y después de la


capacitación a una muestra de trabajadores de una empresa. Existen razones suficientes
para afirmar que la capacitación de los trabajadores ha surtido efecto en el tiempo empleado
con una significancia del 5%
Trabajo
Nº 1 2 3 4 5 6 7
antes capacitación 8 4 10 9 8 7 12
después capacitación 6 3 7 8 5 8 9
d 2 1 3 1 3 -1 3

Formulación de hipótesis estadísticas


Ho: d = 0
H1: d > 0
Prueba estadística: prueba t
Nivel de significancia: α = 0.05
Grados de libertad: n-1= 6
Punto crítico: t(6,0.95) = 1.943180281
Función pivotal

d 1. 714285714
t o= t o=
2
Sd
√ n = √2. 238095238
7 = 3.0317
to = 3.0317 pertenece a la región critica
Decisión: aceptamos la hipótesis alternativa y rechazamos la hipótesis nula
Conclusión: concluimos diciendo que la capacitación ha sido fructífera.

Prueba de hipótesis sobre:


Media poblacional
Varianza poblacional conocida
Varianza poblacional desconocida
Varianza poblacional
Diferencia de medias poblacionales (muestras independientes)
Varianzas poblacionales conocidas
Varianzas poblacionales desconocidas
Varianzas poblacionales desconocidas iguales
Varianzas poblacionales desconocidas diferentes
Diferencia de medias poblacionales (muestras dependientes)
Proporción poblacional
Diferencia de proporciones poblacionales.

Prueba de hipótesis sobre la proporción poblacional P


Formulación de hipótesis estadísticas:
Ho: P = Po
H1: P ≠ Po
H1: P < Po
H1: P > Po
Prueba estadística: Prueba z
Nivel de significancia: α
Puntos críticos:
Prueba bilateral: ± z
Prueba unilateral: -z
z
p−Po
zo=
Po ( 1−Po )
Función pivotal: √ n

Decisión
Elaboración de conclusiones
La oficina de estadística de la FIEECS afirma que el 20% de estudiantes matriculados son mujeres
Se selecciona una muestra aleatoria de 30 estudiantes matriculados en la FIEECS y se encontró
cuatro mujeres. existen razones suficientes para afirmar que existen menos del 20% de mujeres
con una significancia del 5 %
n = 30
p = 0.13333
Po = 0.20
Formulación de hipótesis estadísticas:
Ho: P = 0.20
H1: P < 0.20
Prueba estadística: Prueba z
Nivel de significancia: α = 0.05
Punto crítico: z = 1.644853627
p−Po 0. 133333−0. 20
zo= z o=
Po ( 1−Po ) 0. 20∗0 . 80
Función pivotal: √ n = √ 30 = - 0.912916573
zo = - 0.912916573 pertenece a la región de aceptación bajo la hipótesis nula
decisión: como zo = - 0.912916573 pertenece a la región de aceptación bajo la hipótesis nula,
aceptamos la hipótesis nula y rechazamos la hipótesis alternativa.
Conclusión: concluimos diciendo que el 20% de estudiantes matriculados en la FIEECS son mujeres
con una significancia del 5%

Prueba de hipótesis sobre la diferencia de proporciones poblacionales


Formulación de hipótesis estadísticas:
Ho: Px = Py
H1: Px ≠ Py
H1: Px < Py
H1: Px > Py
Prueba estadística: Prueba z
Nivel de significancia: α
Puntos críticos:
Prueba bilateral: ± z
Prueba unilateral: -z
z
función pivotal
p x− p y
z o=
1 1
√ ^p (1− p^ )
( +
nx n y )
n x p x +n y p y
^p=
n x +n y
Decisiones
Elaboración de conclusiones

De una muestra de 20 estudiantes de la FIEECS se encontró 3 mujeres de las cuales 1 es de


provincias y 17 varones de los cuales 7 son provincianos
Existen razones suficientes para afirmar que el porcentaje de estudiantes provincianos es mayor
que el porcentaje de estudiantes mujeres con una significancia del 5%
X: varones
Y: mujeres
Px: proporción de provincianos
Py: proporción de provincianas
nx = 17
ny = 3
Formulación de hipótesis estadísticas:
Ho: Px = Py
H1: Px > Py
Prueba estadística: prueba z
Nivel de significancia: α = 0.05
Punto crítico: z = 1.644853627
Función pivotal:
p x− p y
z o=
1 1
√ ^p (1− p^ )
( +
nx n y ) = 0.2556549963

n x p x +n y p y
^p=
n x +n y
nx = 17
ny = 3
px = 7/17 =
py = 1/3 =
^p = 0.4
zo = 0.2556549963 pertenece a la región de aceptación bajo la hipótesis nula
decisión: como zo = 0.2556549963 pertenece a la región de aceptación bajo la hipótesis
nula, aceptamos la hipótesis nula y rechazamos la hipótesis alternativa.
Conclusión concluimos diciendo que no existe diferencia entre la proporción de
provincianos y provincianas en la FIEECS.

1. En los folletos de propaganda, de la empresa Focus S.A. asegura que las bombillas que
fabrica tienen una duración media de 1600 horas y una desviación estándar de 10 horas.
A fin de contrastar este dato, se tomó una muestra aleatoria de 36 bombillas,
obteniéndose una duración media de 1596 horas. Asumiendo que la duración de las
bombillas tiene distribución Normal y si Ud. es un inspector de defensa al consumidor
¿Aplicaría una sanción a la empresa Focus por publicar avisos engañosos? Use ∝ =
0.05.
Solución:
Formulación de hipótesis estadísticas
Ho: µ = 1600
H1: µ < 1600
Prueba estadística: prueba z
Nivel de significancia: ∝ = 0.05
Punto crítico: - 1.645
Function pivotal
X−μ o 1596−1600
z o=
σ 10
√n = √ 36 = - 2.4
- 2.4 pertenece a la región critica
Decisión: como - 2.4 pertenece a la región critica, pertenece a la región de rechazo bajo
la hipótesis nula, aceptamos la hipótesis alternativa y rechazamos la hipótesis nula
Conclusión: concluimos diciendo que se aplicaría una sanción a la empresa Focus por
publicar avisos engañosos.

2. En los folletos de propaganda, de la empresa Focus S.A. asegura que las bombillas que
fabrica tienen una duración media de 1600 horas. A fin de contrastar este dato, se tomó
una muestra aleatoria de 36 bombillas, obteniéndose una duración media de 1596
horas, con una desviación estándar de 10 horas. Si Ud. es un inspector de defensa al
consumidor ¿Aplicaría una sanción a la empresa Focus por publicar avisos engañosos?
Use ∝ = 0.05.
Solución:
Formulación de hipótesis estadísticas
Ho: µ = 1600
H1: µ < 1600
Prueba estadística: prueba t
Nivel de significancia: ∝ = 0.05
Punto crítico: t(35, 0.05) = -1.689
Function pivotal
X−μo 1596−1600
t o=
s 10
√n = √ 36 = -2.4
- 2.4 pertenece a la región critica
Decisión: como - 2.4 pertenece a la región critica, pertenece a la región de rechazo bajo
la hipótesis nula, aceptamos la hipótesis alternativa y rechazamos la hipótesis nula
Conclusión: concluimos diciendo que se aplicaría una sanción a la empresa Focus por
publicar avisos engañosos.

3. El jefe de ventas afirma que las cajas de cierto tipo de cereal, procesados por la
fábrica G&S deben tener un contenido promedio de 160 gr. Por una queja ante el
defensor del consumidor de que tales cajas de cereal tienen menos contenido, un
inspector tomó una muestra aleatoria de 10 cajas encontrando los siguientes pesos
de cereal en gramos:

157 157 163 158 161 159 162 159 158 156

¿Es razonable que el inspector multe al fabricante? Utilice un nivel de significación del
4% y suponga que los contenidos tienen distribución normal.

Formulación de hipótesis estadísticas


Ho: µ = 160
H1: µ < 160
Prueba estadística: prueba t
Nivel de significancia: α = 0.04
Punto crítico: : t(9, 0.04) = -1.973
Función pivotal

X−μo 159−160
t o=
s 2 .309401077
√n = √10 = - 1.369306394
- 1.369306394 pertenece a la región de aceptación bajo la hipótesis nula
Decisión: como - 1.369306394 pertenece a la región de aceptación bajo la hipótesis
nula, aceptamos la hipótesis nula y rechazamos la hipótesis alternativa.
Conclusión: concluimos diciendo que el contenido promedio es de 160 gr con una
significancia del 4%

4. Un fabricante afirma que el 30% de todos los consumidores prefiere su producto. Con
el fin de evaluar esta afirmación se tomó una muestra aleatoria de 400 consumidores y
se encontró que 100 de ellos prefieren dicho producto. ¿Es ésta, suficiente evidencia
para inferir que el porcentaje de preferencia del producto no es 30%? Utilice un nivel de
significación de 1%.
Formulacin de hipotesis
Ho: P = 0.30
H1: P < 0.30
Prueba estadistica: prueba z
Nivel de significancia: α = 0.01
Punto critico: -2.326347874
Funcion pivotal:
p−P 0 .25−0.30
zo=
PQ (0 . 3)(0 . 7)
√ n = √ 400 = -2.182178902
-2.182178902 pertenece a la region de aceptacion bajo la hipotesis nula
Decision: como -2.182178902 pertenece a la region de aceptacion bajo la hipotesis
nula, aceptamos la hipotesis nula y rechazamos la hipotesis alternativa.
Conclusion: concluimos diciendo que el porcentaje de preferencia del producto es 30%
Con una significancia del 1%

5. Un minorista desea probar la hipótesis de que la proporción de sus clientes masculinos


que compran a crédito es igual a la proporción de mujeres que compran a crédito. El
minorista, en una selección al azar, encuentra que de 100 clientes que compraron a
crédito, 52 fueron hombres. Realice la prueba de hipótesis, paso a paso, considerando
un nivel de significancia del 5% y determine la conclusión a la que llegará el minorista
Formulación de hipótesis
Ho: P = 0.50
H1: P ≠ 0.50
Prueba estadística: prueba z
Nivel de significancia: α = 0.05
Puntos críticos: ± 1.959963985
Funcion pivotal:
p−P 0.52−0 .50
zo=
PQ (0. 50)(0 .50)
√ n = √ 100 = 0.4
0.4 pertenece a la region de aceptacion bajo la hipotesis nula
Decision: como 0.4 pertenece a la region de aceptacion bajo la hipotesis nula,
aceptamos la hipotesis nula y rechazmos la hipotesis alternativa
Conclusion: concluimos diciendo que la proporción de sus clientes masculinos que
compran a crédito es igual a la proporción de mujeres que compran a crédito.

6. Una muestra aleatoria de 16 sobres de cierto producto, cuyos pesos se distribuyen


normalmente, ha dado una desviación estándar de 0.6 gramos. Utilizando un nivel de
significación del 5%, ¿es válido inferir que la varianza de los pesos de tales sobres es
mayor que 0.25 gramos²?
Formulación de hipótesis estadísticas
Ho: σ2 = 0.25
H1: σ2 > 0.25
Prueba estadística: χ2
Nivel de significancia: α = 0.05
2
Punto crítico:
χ (15,0 .95) = 24.99579014

Función pivotal:
(n−1)S 2 (15)(0 .36)
χ 20 = 2
σ0 = 0. 25 = 21.6
21.6 pertenece a la región de aceptación bajo la hipótesis nula
Decisión: como 21.6 pertenece a la región de aceptación bajo la hipótesis nula,
Aceptamos la hipotesi nula y rechazmos la hipotesis alternativa
Conclusion: concluimos diciendo que la varianza de los pesos de los sobres es igual a
0.25 gramos² con una significancia del 5%

7. Se considera que un proceso de producción no está bajo control si las partes producidas
tienen longitud media distinta de 27.5 mm o una desviación estándar mayor que 0.5
mm. Una muestra de 30 piezas produjo una media y una desviación estándar iguales a
27.63 mm y 0.87 mm, respectivamente. Asumiendo que la longitud de las partes
producidas tienen distribución normal y al nivel de significación de 0.05,
a) ¿Indica la muestra que el proceso debe ser ajustado para corregir a desviación
estándar del producto?
b) ¿Indica la muestra que el proceso debe ser ajustado para corregir el valor medio del
producto?
Solucion:
a) Formulación de hipótesis estadísticas
Ho: σ2 = 0.25
H1: σ2 > 0.25
Prueba estadística: χ2
Nivel de significancia: α = 0.05
2
Punto crítico:
χ (29, 0 .95) = 42.5569678

Función pivotal
(n−1)S 2 (29)(0 . 7569)
χ 20 =
σ 20 = 0 .25 = 87.8004
87.8004 pertenece a la región critica
Decision: como 87.8004 pertenece a la región critica, aceptamos la hipótesis alternativa
y rechazamos la hipótesis nula
Conclusión: concluimos diciendo que el proceso debe ser ajustado para corregir a
desviación estándar del producto
b) Formulación de hipótesis estadísticas
Ho: µ = 27.5
H1: µ ≠ 27.5
Prueba estadística: prueba t
Nivel de significancia: α = 0.05
Punto crítico: : ± t(29, 0.975) = ± 2.054855167
Función pivotal:
X−μo 27 .63−27 . 5
t o=
s 0. 87
√n = √ 30 = 0.8184360055
0.8184360055 pertenece a la región de aceptación bajo la hipótesis nula
Decisión: como 0.8184360055 pertenece a la región de aceptación bajo la hipótesis
nula, aceptamos la hipótesis nula y rechazamos la hipótesis alternativa.
Conclusión: concluimos diciendo que el proceso no debe ser ajustado para corregir el
valor medio del producto con una significancia del 5%

8. Un grupo de 10 consumidores elegidos al azar fue requerido a manifestar su grado de


satisfacción respecto al jabón “Kamai” en una puntuación de 0 a 20. Luego, se
presentó a estos consumidores un video comercial del producto. A continuación, e
inmediatamente después de la presentación del comercial, se solicitó al grupo
manifestar su grado de satisfacción por el producto. Los resultados fueron:
Antes del comercial 12 8 9 11 13 15 10 6 7 8
Después del comercial 13 12 15 12 10 11 12 8 14 16
¿El comercial tiene algún efecto significativo sobre la satisfacción por el producto?
Use  = 0.04. Asuma que la puntuación se distribuye normalmente.
Formulación de hipótesis estadísticas
Ho: µA - µB = 0
H1: µA - µB < 0
Prueba estadística: prueba t
Nivel de significancia: α = 0.05
Punto crítico: : - t(9, 0.95) = - 1.8331
Función pivotal:
d−0 −2 . 4−0
t o=
sd 3 . 977715704
√n = √ 10 = -1.907996184
d = -2.4
s d = 3.977715704

Después
Antes del
del
comercia d
comercia
l
l
12 13 -1
8 12 -4
9 15 -6
11 12 -1
13 10 3
15 11 4
10 12 -2
6 8 -2
7 14 -7
8 16 -8

-1.907996184 pertenece a la región critica


Decisión: como -1.907996184 pertenece a la región critica, aceptamos la hipótesis
alternativa y rechazamos la hipótesis nula
Conclusión: concluimos diciendo que el comercial tiene efecto significativo sobre la
satisfacción por el producto.

También podría gustarte