Está en la página 1de 26

CAPITULO 3

ESTIMACIONES

3. INTRODUCION

La Estadística Inferencial es la parte de la estadística en la que se hacen afirmaciones de


la población o de sus parámetros en base a la información obtenida de una muestra o
muestras extraídas de dicha población o se toman decisiones frente a la incertidumbre.
En este capítulo trataremos temas respecto a:

a) Estimación de parámetros.
b) Prueba de hipótesis sobre parámetros.
c) Prueba de independencia chi-cuadrado.

3.1. ESTIMACION DE PARÁMETROS

Es un proceso de estadísticas inferencial que tiene por la finalidad aproximar el valor


del parámetro poblacional a partir de los datos tomados de una muestra.

Existen dos formas de realizar de estimación de parámetros: la estimación puntual y la


estimación por intervalo.

3.1.1. Estimación Puntual: Es la estimación de un parámetro poblacional hecha en un


solo valor o punto de la muestra. Por ejemplo: la media muestral, la desviación estándar
muestral, etc.

3.1.2. Estimación por Intervalos: Especificas el rango dentro del cual está el
parámetro desconocido y el nivel de confianza que el intervalo contiene del parámetro.
Por lo tanto se llama Intervalo de Confianza.

En base a una muestra aleatoria y la correspondiente estadística θ^ , se trata de encontrar


un intervalo [L1, L2] llamado Intervalo de Confianza que debe contener el parámetro θ
con una probabilidad dada (1- α ) llamado nivel de confianza.
El intervalo [L1, L2] es un intervalo aleatorio ya que sus extremos L1 y L2, llamados
límites de confianza, son variables cuyos valores de una muestra a otra.

La Estimación Interválica consiste en calcular L1 y L2, dada una muestra aleatoria y un


nivel de confianza (1- α ) y decir que se tiene confianza del 100(1- α ) que el intervalo
contiene el valor desconocido θ.

Por ejemplo: Si 1-α = 0.95, se dice que se tiene una confianza del 95% que el intervalo
contenga el valor desconocido θ; o bien de 100 intervalos aleatorios que se tomen 95 de
las veces contendrá el parámetro y solo 5 veces no lo contendrá.

Estudiaremos la estimación de intervalos de confianza para la media población,


proporcional, diferencia de medias poblaciones diferencia de proporciones
poblacionales.

3.1.2.1. Intervalo de Confianza para la Media Poblacional

P [L1≤ μ ≤ L2] = 1- α

α/2 1-α α/2

L1 L2

Se presentan los siguientes casos:

CASO I: Uso de la Estadística Z.

i) Muestra grande (n ≥ 30), varianza poblacional conocida σ 2 y población


normal o no.

σ
L1 = x – Z0 x σ x = x – Z0 x
√n
σ
L2 = x + Z0 x σ x = x + Z0 x
√n
ii) Muestra grande (n ≥ 30), varianza poblacional desconocida ( σ 2 ~¿ s2 ) y
población normal o no.

s
L1 = x – Z0 x s x = x – Z0 x
√n
s
L2 = x + Z0 x s x = x + Z0 x
√n
iii) Muestra pequeña (n < 30), varianza poblacional conocida σ 2 y poblacional
normal.
σ
L1 = x – Z0 x σ x = x – Z0 x
√n
σ
L2 = x + Z0 x σ x = x + Z0 x
√n
CASO II: Uso de la Estadistica t.

Muestra pequeña (n < 30), varianza poblacional desconocida (σ 2 ~¿ s2 ) y poblacional


normal.

s
L1 = x – t0 x s x = x – t0 x
√n
s
L2 = x + t0 x s x = x + t0 x
√n
Donde: t0 = t1- α/2,n-1

OBSERVACIONES:

A) Error Estándar de la Media:


- Si el muestreo es con o sin reposición en una población infinita (o con
sustitución en una población finita de tamaño N), el error estándar de la media
muestral es:
σ
i) σx = → ( σ 2 conocida)
√n
s
ii) sx = → ( σ 2 conocida)
√n
- Si el muestreo es sin reposición en una población finita de tamaño N, el error
estándar de la media muestra es:

i)

σ x = σ N −n → ( σ 2 conocida)
√ n N −1
ii)

s x = s N −n → ( σ 2 conocida)
√ n N −1

Donde
√ N −n
N −1
es el factor de corrección para población finita.

B) Error de Estimación:
|x−μ|. Ver fig.26:
error

L1 x μ L2

El valor mínimo del error de estimación es igual a cero, esto ocurre cuando x estima
exactamente a μ. El valor numérico máximo del error de estimación es igual a Z 0 x σ x ,
ya que el intervalo de estimación resulta: |x−μ| ≤ Z0 x σ x .

Ejemplo 3. 1:

Una compañía desea estimar la duración media de tiempo que necesita una secretaria
para llegar del trabajo a su casa. En una muestra al azar de 40 secretarias se encuentra
que la media es de x= 60 minutos. Suponiendo que
σ =15 minutos y el coeficiente de confianza del 95 % , construir un intervalo de confianza
para la media poblacional.

Solución:

- Sea X: el tiempo en minutos que emplea una secretaria para llegar del trabajo a
su casa, cuya media se quiere estimar a partir de una muestra de tamaño n=40.
- Se conoce que x =60 minutos y σ = 15 minutos.
- Usamos la estadística Z- Caso 1- i
- Para el nivel de confianza 1- α 0.95, el valor Z0 = 1.96
- El error estándar de la media muestral x es:
σ 15
σx = = = 2.37
√ n √ 40
- Los límites de confianza para μ son:
σ
L1 = x – Z0 x = 60 – 1.96 x 2.37 = 55.35 minutos.
√n
σ
L2 = x + Z0 x = 60 + 1.96 x 2.37 = 64.65 minutos.
√n
- Se tiene una confianza del 95% que el tiempo medio que emplea una secretaria
para llegar del trabajo a su casa varia de entre 55.35 y 64.65 minutos.

Ejemplo 3.2:

Los ingresos semanales promedio de las personas que trabajan en varias industrias
aparecieron en el The New Cork Times 1998. Esos ingresos para quienes trabajan en los
servicios legales fueron 5639 dólares. Suponga que este resultado se basó en una
muestra de 250 personas dedicadas a los servicios legales, y que la desviación estándar
de la muestra de $50. Calcule el intervalo de confianza de 95% para la población de
ingresos medios semanales de personas que trabajan en los servicios legales.

Solución:

- Sea X: El ingresos semanal en dólares de las personas que trabajan en los


servicios legales.
- n= 250 (muestra grande n > 30)
- Con x = $5639 y s=$50
- Usamos la estadística Z- Caso I-ii
- Para el nivel de confianza 1-α = 0.95, el valor Z0 = 1.96
- El error estándar del media muestral es:
s 50
sx = = = 3.16
√ n √250
- Los límites de confianza para μ son:
s
L1 = x – Z0 x = 5639 – 1.96 x 3.16 = 5632.81
√n
σ
L2 = x + Z0 x = 5639 + 1.96 x 3.16 = 5645.19
√n
- Los ingresos medios semanales para quienes trabajan en varias industrias para
los servicios legales varía entre $5632.81 y $5645.19 con una confianza del
95%.

Ejemplo 3.3:

Los siguientes datos corresponden a pensiones de alimentos en soles de 15 demandas


judiciales:

200, 320, 180, 250, 350, 250, 190, 330.

220, 210, 220, 200, 215, 310, 300.

Suponiendo que la población de las pensiones esta distribuidas normalmente construir el


intervalo de confianza de 95% para las pensiones judiciales de alimentos.

Solución:

- Sea X: Pensiones de alimentos en soles.


- n= 15 ( muestra pequeña n < 30 )
con x = S/.249.67 Y s= S/.57.02
La media muestral y desviación estándar se obtiene de los datos dados.
- Usamos las estadísticas t.
- Para un nivel de confianza del 95% el valor de t0 es:
T0 = t0.975.14 = 2.145
- El error estándar de la media muestral es:
s 57.02
SX = = =14.72
√ n √15
- Los límites de confianza para μ son:
s
L1 = x – t0 x = 249.67 – 2.145 x 14.72 = S/.218.10
√n
s
L2 = x + t0 x = 249.67 + 2.145 x 14.72 = S/.281.24
√n
- Las pensiones de alimentos varían de entre S/.218.10 y S/.281.24 con una
confianza del 95%.

Ejemplo 3.4:

De un lote de 2200 calculadoras científicas se probó 81 al azar. La vida promedio en


la muestra fue de 3.2 años con una desviación estándar de 0.9 años. Construya un
intervalo de confianza del 95% para la vida media de las calculadoras científicas.

Solución:

- Sea X: El tiempo de vidas en años de las calculadoras científicas.


N=2200 (población finita)
n= 81 con x = 3.2 años y s= 0.9 años.
- Usamos Z- Caso I – ii
- Para el nivel de confianza 1 – α = 0.95, el valor Z0 = 1.96.
- El error estándar de la media muestral es:


s x = s N −n
√ n N −1

√ √
s x = 0.9 2200−81 = 0.1
81 2200−1
- Los límites de confianza para μ son :
s
L1 = x – Z0 x = 3.1 – 1.96 x 0.1 = 3.0 años
√n
s
L2 = x + Z0 x = 3.2 + 1.96 x 0.1 = 3.4 años
√n
- Se tiene una confianza del 95% de que el tiempo de vida media de las
calculadoras científicas varía entre de 3.0 y 3.4 años.

3.1.2.2. Intervalos de Confianza para la Proporción Poblacional

P [L1≤ P ≤ L2] = 1- α
1-α
α/2 α/2

L1 L2
P

Para hallar los intervalos de confianza para la proporción poblacional usaremos la


estadística Z para muestras grandes (n ≥ 30). Entonces los límites de confianza serán:

L1 = p – Z0 x s p = p – Z0 x
√ pxq
n

L2 = p + Z0 x s p = p + Z0 x
√ pxq
n

OBSERVACIONES:

A. Erro estándar de la proporción


Si el tamaño de la muestra es suficiente grande (n ≥ 30) y el muestreo es con o
sin sustitución en una población finita de tamaño N), el error estándar es:


σ P = P(1−P) que se estima por:
N


s P = P(1−P)
N

Si el muestreo es sin sustitución en una población finita de tamaño N, el error estándar


es:


σ P = P(1−P)
N √ N −n
N −1
que se estima por


s P = P(1−P)
N √ N −n
N −1

Donde:
√ N −n es el factor de corrección para la población finita.
N −1

Ejemplo 3.5:

Una muestra de 400 menores de 16 años revela que 220 consumen drogas. Estimar la
proporción de menores de 16 años que consumen drogas en toda la población mediante
un intervalo de confianza del 99%.

Solución:

- Observamos que la proporción muestral de menores de 16 años que consumen


drogas es:
220
p= =0.55 → q=0.45
400
- Para un nivel de confianza del 99% el valor de Z0 = 2.576
- El error estándar de la proporción muestral es:

- sP =
√ pxq
n
=¿ ¿

0.55 x 0.45
400
= 0.02

- Los límites de confianzas para P son:

L1 = p – Z0 x
√ pxq
n
= 0.55 – 2.576 x 0.02 = 0.5

L2 = p + Z0 x
√ pxq
n
= 0.55 + 2.576 x 0.02 = 0.6

- Se tiene una confianza del 99% de que entre el 50% y 60% de los jóvenes
menores de 16 años consumen drogas.

Ejemplo 3.6:

Mediante un muestreo al azar de 49 de 500 compradores en la exposición de libros


sobre Psicopedagogía en la Feria del Pacifico, el Gerente de Ventas de la Compañía
Editora encontró que el 80% de estos clientes se interesó por el nuevo libro.
Establezca un intervalo de confianza del 96% para la proporción de compradores
interesados por dicho libro.

Solución:
- Observamos que N = 500 y n= 49
- Observamos también que la proporción muestral de compradores del nuevo libro
es p= 0.80 → q = 0.02
- Para un nivel de confianza del 96%, el valor Z0 = 2.054
- El error estándar de la proporción muestral es:

sP =
√ √
pxq
n
N −n
N −1

√ √
s P = 0.08 x 0.20 =¿ ¿ 500 x 49
49 500−1
Sp = 0.06
- Los límites de confianza para P son:

L1 = p – Z0 x
√ pxq
n
X
√ N −n
N −1
= 0.80 – 2.054 x 0.06 = 0.68

L2 = p + Z0 x
√ pxq
n
=¿ ¿

N −n .
N −1
= 0.80 + 2.054 x 0.06 = 0.92

- Se tiene una confianza del 96% de que entre el 68% y 92% de los compradores
se interesó por el nuevo libro.

3.1.2.3. Intervalo de Confianza para la Diferencia de Medias Poblacionales


Se presentan los siguientes casos:

CASO I: Usando la estadística Z.

i) Muestra grandes (n1 ≥ 30 y n2 ≥ 30), varianzas poblacionales conocidas ( σ 21,


2
σ 2 ) y poblaciones normales o no.

L1 = ( x 1 - x 2 ) – Z0 x σ x −x 1 2

L2 = ( x 1 - x 2 ) + Z0 x σ x −x 1 2

Donde:


2 2
σ x −x = σ ¿ + σ 2
n1 n2
1 2

ii) Muestra grandes (n1 ≥ 30 y n2 ≥ 30). Varianzas poblacionales desconocidas (


2~ 2 2~ 2
σ 1 ¿ s1 y σ 2 ¿ s2 ) y poblaciones normales o no.

L1 = ( x 1 - x 2 ) - Z0 x s x − x 1 2

L2 = ( x 1 - x 2 ) + Z0 x s x − x 1 2

Donde:


2 2
sx − x = s¿ s2
+
n 1 n2
1 2

iii) Muestra pequeñas (n1 < 30 y n2 < 30), varianzas poblacionales conocidas y
poblaciones normales.
L1 = ( x 1 - x 2 ) - Z0 x σ x −x 1 2

L2 = ( x 1 - x 2 ) + Z0 x σ x −x 1 2

Donde:


2
σ x −x = σ ¿ + σ 2
2

n1 n2
1 2

NOTA: En caso de que las poblaciones N1, N2 fueran finitas, se debe corregir:

σ x −x =
1 2
√ ( +
n1 N 1−1 n2 N 2−1 ) (
σ 21 N 1−n1 σ 22 N 2−n2
)
s21 N 1−n 1 s 22 N 2−n 2
CASO II: Usando la estadística t
i) Muestra pequeñas (n1 < 30 y n2 < 30), varianzas poblacionales desconocidas
~ ~
pero iguales σ 12 = σ 22 ( σ 21 ¿ s21 y σ 22 ¿ s22 ) y poblaciones normales.

Donde:

L1 = ( x 1−x 2 ¿−t 0 x S C
√ 1 1
+
n1 n2

L2 = ( x 1−x 2 ¿+ t 0 x SC
√ 1 1
+
n 1 n2

Donde:

s x − x =S C
1 2
√ 1 1
+
n1 n 2

SC =
√ ( n1 −1 ) x s 21+ ( n2−1 ) x s 22
n1 +n2−2

t o=t α
1− ,n1+n2−2
2

ii) Muestras pequeñas (n1 < 30 y n2 < 30), varianza poblacionales desconocidas
~ ~
pero diferentes σ 21 ≠ σ 22 ( σ 21 ¿ s21 y σ 22 ¿ s22 ) y poblaciones normales.

√ √
2 2 2 2
s1 s 2 s 1 s2
L1 = ( x 1−x 2 ¿−t 0 + L2 = ( x 1−x 2 ¿+ t 0 +
n1 n2 n1 n2

Donde:
t o=t 1−α/ 2 ,r
[ ]
2
s 21 s22
+
n 1 n2

[] []
r= 2 2 2 2
s1 s2
n1 n2
+
n 1−1 n2−1

Dado que rara vez r es un entero, se redondea al entero más cercano.


Ejemplo 3.7:
Se quiere estimar la diferencia entre los promedios de tiempos (en minutos) que utilizan
dos trabajadores del Poder Judicial para realizar una determinada tarea. Suponga que las
poblaciones de los dos tiempos son normales con varianza común. Estime la diferencia
entre los dos promedios poblacionales
Cada trabajador ha dado x 1=38 , s 1=6 y x2 =35 , s2 =4
Solución:
- Sean x1 y x2 las varianzas aleatorias que representan los tiempos empleados por
los dos trabajadores, respectivamente.
- De las muestras dadas obtenemos:
n1 = 16, x 1=38 minutos, s1 = 6 minutos
n2 = 16, x 2=35 minutos, s1 = 4 minutos
Haremos uso de la estadística t.
- Las diferencias de medias muestrales es:
x 1−x 2=38−35=3
- El error estándar de la media muestral es:

- s x − x =S C
1 2
√ 1 1
+ = 1.80
n1 n 2
Donde:

SC =
√ ( n1 −1 ) x s 21+ ( n2−1 ) x s 22
n1 +n2−2

sc =5.10

- Para un nivel de confianza del 95% el valor de tc es:


t0 = t0.975.30 = 2.042
- Los límites de confianza para la diferencia de medias poblacionales es:
L1 = 3-2.042 x 1.785 =-0.68 minutos
L2 = 3+2.042 x 1.785 = 6.68 minutos
- Luego el intervalo de confianza del 95% para μ1 – μ2 es:
-0.68 ≤ μ1 – μ2 ≤ 6.68

Dado que μ1 – μ2 = 0 є al intervalo de confianza [-0.68, 6.68], podemos concluir que μ 1


= μ2; por lo tanto los tiempos que utilizan ambos trabajadores para realizar una
determinada tarea iguales.

Ejemplo 3.8:

Con el fin de comparar el rendimiento medio en la catedra de Derecho Romano de las


Facultades de Derecho de dos Universidades, una estatal y otra privada, se tomaron dos
muestral aleatorias y se les aplico un examen de 100 preguntas. En dicha prueba se
obtuvieron los siguientes resultados.

n x S
Universidad 50 85 12
Privada 60 71 14
Universidad Estatal

Construir el intervalo de confianza del 95% para la diferencia de las medias


poblacionales.

Solución:

- Sean X1 , X2 las variables aleatorias que representan los puntajes para ambos
grupos.
- De las muestras dadas obtenemos:
n1 = 50, x = 85 puntos, s1 =12 puntos
n2 = 60, x = 71 puntos, s1 =14 puntos
Haremos uso de la estadística Z.
- Las diferencias de medias muestrales es:
x 1−x 2=85−71=14
- Error entandar de la media muestral es:


2 2
s s
sx − x = 1 + 2
1
n 1 n2
2

s x − x =S C √ ¿ ¿ ¿
1 2

s x − x = 2.48
1 2

- Para un nivel de confianza del 95% , el valor Z0 = 1.96


- Los límites de confianza para la diferencia de medias poblacionales es:
L1 = 14 - 1.96 x 2.48 = 9.14
L2 = 14 - 1.96 x 2.48 = 18.86

- Luego el intervalo de confianza del 95% para μ1 –μ2 es:


9.14 ≤ μ1 –μ2 ≤ 18.86. Dado que μ1 – μ2 = 0 ∄ al intervalo de confianza, lo que
quiere decir que los rendimientos de ambos grupos son diferentes, en este caso
μ1 – μ2 >0. Los alumnos de las universidades privadas tienen mayores
rendimientos que los alumnos de las universidades estatales.

Ejemplo 3.9:

Para comparar los gastos promedios mensuales de los alumnos de dos universidades
particulares se escogen dos muestras aleatorias de 10 y 9 alumnos, respectivamente,
resultados los siguientes gastos en dólares:

Muestra 1: 400, 410, 420, 380, 390, 410, 400, 405, 405, 400.

Muestras 2: 390, 395, 380, 390, 400, 380, 370, 390, 380.

Mediante un intervalo de confianza del 95% para la diferencia de promedio de los


gastos mensuales, ¿Se pueden inferir que los gastos promedios son iguales supongan
que ambas poblaciones son normales, independientes, con varianza desconocida
supuestas iguales?

Cálculos realizados con las muestras dadas:

i n1 x1 s1
Muestra 1 10 402 11.11
Muestra 2 9 386.11 9.28
2 2
- Haremos uso de la estadística t, cuando σ 1 = σ 2
- La diferencia de medias muéstrales es:
x 1−x 2=402−386.11=15.89
- Para un nivel de confianza del 95% →
t 0=t 1−α / 2.n +n −2 = t 0.975.17 =2.11
1 2

- s x − x =S C
1 2
√ 1 1
+ = 4.73
n1 n 2
Donde:

SC =
√ ( n1 −1 ) x s 21+ ( n2−1 ) x s 22 = 10.29
n1 +n2−2

- Los límites de confianza para la diferencia de medias poblacionales son:

L1 = ( x 1−x 2 ¿−t 0 x S C
√ 1 1
+
n1 n2
L1 = 15.89 - 2.11 x 4.73 = $5.91

L2 = ( x 1−x 2 ¿+ t 0 x SC
√ 1 1
+
n 1 n2
L2 = 15.89+2.11 x 4.73 = $25.87
- Luego el intervalo de confianza del 95% para μ1-μ2, es:
5.91 ≤ μ1 –μ2 ≤ 25.87. Dado que μ1 – μ2 = 0 ∄ al intervalo de confianza, quiere decir
que los gastos promedios mensuales no son iguales. Por lo tanto μ1 – μ2 > 0. Los
gastos semanales del grupo 1 son mayores que los gastos semanales del grupo 2.
Ejemplo 3.10:
Se lleva a cabo un estudio para comparar el tiempo que tardan hombres y mujeres
para realizar determinada tarea. Las experiencias anteriores indican que la
distribución de tiempos tanto hombres como para mujeres es normal con varianza
diferente. Una muestra aleatoria de 9 hombres y 8 mujeres ha dado los siguientes
tiempos en minutos:
Hombres 13, 27,10, 25, 24, 19, 21, 32, 16
Mujeres: 16, 21, 16, 21, 16, 17, 16, 20
Mediante un intervalo de confianza del 95% para la verdadera diferencia de los
promedios de tiempos de hombres y mujeres ¿Se pude concluir que los hombres
emplean mayor tiempo que las mujeres para hacer la tarea?
Solución:
- Sean X1 y X2 las variables aleatorias que representan los tiempos empleados por los
hombres y mujeres, respectivamente:
- Cálculos realizados con las muestras dadas:

i n1 x1 s1
Muestra 1 9 20.78 7.03
Muestra 2 8 17.88 2.36

- Haremos uso de la estadística t cuando σ 21 ≠ σ 22


- La diferencia de medias muéstrales es:
x 1−x 2=20.78−17.88=2.9


2 2
s 1 s2
sx − x = + = 2.49
1 2
n 1 n2
- Hallando los grados de libertad r

[ ] [
2 2

]
2 2 2
s 1 s2 2
( 7.03 ) ( 2.36 )
+ +
n 1 n2 9 8

[] [] [ ][ ]
2 2
r= s21 = ( 7.03 )2 2 ( 2.36 )2
s 22
2

n1 9 n2 8
+ +
n 1−1 n2−1 8 7

r = 9.97 ~¿ 10
- Para un nivel de confianza del 95% → t 0 =t 0.975,10 =2.228
- Los límites de confianza para la verdadera diferencia de los promedios de
tiempo de hombres y mujeres para hacer la tarea es:


2 2
s1 s 2
- L1 = ( x 1−x 2 ¿−t 0 +
n1 n2
- L1 = 2.9 - 2.228 x 2.49 = -2.65

- L2 = ( x 1−x 2 ¿+ t 0
√ s 21 s22
+
n1 n2
- L2 = 2.9+2.228 x 2.49 = 8.45
- Luego el intervalo de confianza para μ1-μ2, es:
-2.65 ≤ μ1 –μ2 ≤ 8.45. Dado que μ1 – μ2 = 0 ∈ al intervalo de confianza, quiere
decir que los promedios de tiempo de hombres y mujeres para hacer la tarea son
iguales.

3.1.2.4. Intervalo de Confianza para Diferencia de Medias Poblacionales con


Observaciones Pareadas

Un procedimiento comúnmente utilizado que da como resultado dos muestras no


independientes es la denominada prueba “antes y después”. Las mediciones se hacen
sobre sujetos tanto antes como después de la introducción de algún fenómeno. Por
ejemplo, si se realizan una prueba sobre un método de enseñanza utilizando un grupo de
individuos, las muestras están formados por los puntajes “antes y después” de un
periodo de prueba.

También cuando comparamos la media de dos poblaciones puede ocurrir una diferencia
significativa por causa de factores externos no controlados. Por ejemplo, cuando
comparamos dos técnicas de venta A y B puede ocurrir que uno de los grupos tenga
vendedores más experimentados y hábiles que el otro grupo. Así, la diferencia seria
debido a esos factores y no al mérito real de la técnica de venta. Un modo de controlar
este problema es a través del artificio de recolectar observaciones en pares de modo que
los elementos de cada par sea homogéneo en todos los sentidos, excepto con respecto al
factor que queremos comparar.

Los dos grupos de observaciones que resultan de esta clase de procedimientos están
indudablemente relacionados.

En la práctica cuando queremos hallar un estimador de la diferencia entre dos medias


poblacionales μD = μ1 – μ2, puede presentarse los siguientes casos:

CASO I: Uso de Z
~
Cuando n ≥ 30 σ 2D ¿ s 2D (varianzas poblacional de las diferencias es desconocida) y la
población es normal, entonces:

P [ L1 ≤ μ D ≤ L2 ]=1−α

Donde:
2
SD
L1=D−Z 0 x
√n

S 2D
L2=D+ Z 0 x
√n
Además:

n n

∑ D1 y
∑ ( D1−D )2
D= i=1 s2D= i=1
n n

CASO II: Uso de t.

2 ~ 2
- Cuando n < 30 σ D ¿ s D (varianzas poblacional de las diferencias es desconocida)
y la población es normal, entonces:
P [ L1 ≤ μ D ≤ L2 ]=1−α

Donde:

2 2
SD SD
L1=D−t 0 x L2=D+t 0 x
√n √n
Además:

n n

∑ D1 y
∑ ( D1−D )2
D= i=1 s2D= i=1
n n

t 0=t α
1− , n−1
2

Ejemplo 3.11:

Veinte estudiantes de Matemáticas de la Facultad de Ingeniería Industrial de la


Universidad de Lima fueron divididos en 10 parejas, teniendo cada miembro de la
pareja aproximadamente el mismo coeficiente el mismo coeficiente de inteligencia de
inteligencia. Uno de cada pareja se selecciona al azar y se asigna a una sección que
utiliza videos. El otro miembro se asigna a una sección que cuenta con profesor. Al
finalizar el ciclo ambos grupos se presentan al mismo examen, obteniéndose los
siguientes resultados:
Pareja Con video Con
profesor
1 15 16
2 12 10
3 17 17
4 11 14
5 18 17
6 15 16
7 16 18
8 13 12
9 14 15
10 10 11

Suponiendo que la características en estudio sea normal. Obtener el intervalo de


confianza del 98% para la diferencia real en el promedio de calificación de los dos
procedimientos de enseñanzas con base a los resultados. ¿Se puede concluir que el
procedimiento de enseñanza con profesor mejor que con el de video?

10 10

∑ D1 y ∑ ( D1−D )2 =1.51
i=1 2 i=1
D= =−0.5 s D=
10 s9

Además: t 0=t 0.99 .9=2.821

Entonces:

S 2D 1.51
L1=D−t 0 x = - 0.5 – 2.821 x = - 1.85
√n √ 10

S2D 1.51
L2=D+t 0 x = - 0.5 + 2.821 x = 0.85
√n √10
Por lo tanto μD є [-1.85,0.85] con confianza del 98%. Como 0 є [[-1.85,0.85], entonces
μx = μy. Los procedimientos de enseñanza son iguales.

3.1.2.5. Intervalo de Confianza para la Diferencia de Proporciones Poblacionales


Para hallar los intervalos de confianza para la diferencia de proporciones poblacionales
haremos uso de la estadística Z para muestras grandes (n1 ≥ 30 y n2 ≥ 30). Entonces:

L1 = ( p1− p2 ¿−Z 0 x s p − p1 2

L2 = ( p1− p2 + Z 0 x s p − p
1 2

Donde:

sp − p =
1 2
√ p1q1 p2q2
n1
+
n2

Ejemplo 3.12:

En los establecimientos penales de Lima ciertos médicos estudiaron dos tipos de


recursos. Una muestra de 300 internos del tipo I revelo que 50% era adicto a las drogas.
En otra muestra aleatoria del tipo II DE 240 internos, el 35% era adicto a las drogas.
Construir un intervalo de confianza del 99% para la diferencia de las dos proporciones
poblacionales.

Solución:

- Las muestras de internos tomadas para cada tipo revelan las siguientes
información:
Tipo I Tipo II
n n1 = 300 n2 = 240
p p1= 0.50 p2 = 0.35

- Las diferencias de proporciones muéstrales es:


p1-p2 = 0.50 – 0.35 = 0.15
- El error estándar de las diferencias de proporciones muéstrales es:

sp − p =
1 2
√ 0.50 x 0.50 0.35 x 0.65
300
+
240
=0.04

- Para un nivel de confianza del 99%; Z0 = 2.576


- Los límites de confianza para la diferencia de proporciones poblaciones es:
L1 = 0.15 - 2.576 x 0.04 = 0.05
L2 = 0.15 + 2.576 x 0.04 = 0.25
Luego, el intervalo de confianza del 99% para P1 – P2 es:
0.05 ≤ P1 – P2 ≤ 0.25
Dado que P1 – P2 = 0∄ al intervalo de confianza, lo que quiere decir que los tipos
de reclusos son diferentes ante su adicción a las drogas. Los reclusos tipos I
tienen mayor adicción a las drogas que los reclusos de tipo II.

NOTA: En caso de que las poblaciones N1 y N2 fueran finitas, se debe corregir:

sp − p =
1 2
√ n1 (
N 1−1 )
+
n2 (
p 1 x q1 N 1 −n1 p 2 x q2 N 2 −n2
N 2−1 )

PROBLEMAS PROPUESTOS N° 3

1. Se decide estimar la medida del nivel de ansiedad de todos los estudiantes pre
universitario. Se supone que la población de los puntajes de la prueba se
distribuyen normalmente con desviación estándar igual a 10 puntos.
a) Determinar el intervalo para una confianza del 95%, si una muestra
aleatoria de tamaño 100 ha dado una medida de 70 puntos.
b) Si μ se estima en 70 puntos con el nivel de confianza del 99%, ¿Es el error
de estimación puntual superior a 5 puntos?
2. El tiempo en minutos que te dicen los clientes en sus distintas operaciones en
un banco local es una variable aleatoria estándar de 3 minutos. Se han
registrado en los tiempos de las operaciones de 9 clientes del banco resultando
una media igual a nueve minutos.
a) Hallar el nivel de confianza si la estimación de μ es el intervalo de 7a 13
minutos.
b) Si μ se estima por x , calcular la probabilidad de que la media de los
tiempos de todas las muestras de tamaño 9 este 6.5 y 11.5 minutos.
3. Suponga que las alturas de los alumnos de la Facultad de Economía tienen
distribución normal con σ =15 cm. Fue retirada una muestra de 100 alumnos
obteniéndose x=175 cm . Construir el intervalo de confianza para la verdadera
altura media de los alumnos con 95% de confianza.
4. La Cámara de Comercio de una ciudad está interesada en estimar la medida de
la cantidad de dinero que gasta la gente que asiste a convenciones,
considerando comida, alojamiento y entretenimiento por día. De las distintas
convenciones que se llevan a cabo en la ciudad se seleccionaron a 16 personas
aleatoriamente y se les pregunto la cantidad que gastaba por día. Se obtuvo en
la siguiente información en soles:
450,575, 363, 448, 542, 389, 435, 674, 468, 352, 458, 384, 434, 546, 655, 560.

Obtenga el intervalo de confianza del 99% para la media de cantidad de dinero


que gasta diariamente la gente que asiste a convenciones intérprete el
resultado.

5. Una muestra aleatoria extraída de una población normal presenta una media
muestral igual a 150, el número de observaciones es 21 y la varianza muestral
es 100. Se pide:
a) Construir un intervalo de confianza del 95% para la media poblacional.
b) Si se utiliza la información de que la varianza poblacional es 100, calcular el
intervalo de confianza del 95% para la media poblacional.
c) ¿Por qué el intervalo calculado (b) es más estrecho que en a? ¿Qué ocurrirá
con ambos intervalos si se amplía el tamaño de muestra?

Intervalo de confianza para la proporción poblacional

6. Con el objetivo de estimar la proporción de televidentes que han visto el


anuncio de un producto, se entrevistó a 400 telespectadores y resultó que 344
de ellos si los habían visto. Encuentre un intervalo de confianza del 95% para la
proporción de todos espectadores que han visto la publicidad del producto.
7. De 209 clientes, 183 expresaron su satisfacción con los servicios bancarios
ofrecidos por el Banco de Crédito en la ciudad de Chimbote. ¿Cómo se compara
estos resultados de un estudio anterior por parte de la Encuestadora Apoyo
S.A., el cual estimo al 95% del nivel de confianza que entre el 74.1% Y el 83.7%
de sus clientes estaban satisfechos?
8. En un sondeo reciente de 250 personas que viven en Lima, 50 aprobaron el
establecimiento de la pena de muerte para los delitos por terrorismo. Construir
un intervalo de confianza del 99% para la proporción real de los limeños que
están de acuerdo con la pena de muerte por terrorismo.
9. Si en una muestra de 600 estudiantes de economía, 360 son hijos de hombres
de negocios. Obtenga un intervalo aleatorio con un nivel de confianza del 90%
para la proporción de todos los estudiantes de economía que son hijos de
hombres de negocios. El número de estudiantes de economía en todo el país se
estima en 15 000.

Intervalo de confianza para la diferencia de dos medias poblacionales

10. El consumo medio en gasolina de las familias de Lima en la última semana se ha


estimado a través de una muestra aleatoria simple de 300 familias,
obteniéndose para la misma una media de 20 litros y una desviación estándar
de 5 litros. Análogamente, en Trujillo se preguntó a 250 familias obteniéndose
una media de 15 litros y una desviación estándar de 8 litros. Calcular una
estimación para la diferencia entre los consumos medios con un de confianza
del 90% ¿Cuál es el error cometido en esta estimación?
11. Se realizó un estudio para determinar la diferencia del Coeficiente Intelectual
(CI) entre los niños del distrito de Chiclayo y de José L. Ortiz. Se obtuvieron los
siguientes resultados:

Distrito n x s
Chiclayo 30 115 9
José L. Ortiz 40 90 16

Se sabe que el coeficiente intelectual (CI) de las dos poblaciones está


distribuido normalmente. Construir el intervalo de 95% de confianza para la
diferencia de las dos medias poblacionales.

12. Se quieres estimar la diferencia entre los promedios de tiempo (en minutos)
que utilizan los hombres y las mujeres para realizar un test de aptitud. Se aplica
el test a 20 hombres Y 25 mujeres dando las medidas respectivas de 110 y 100
puntos. Suponga que las dos poblaciones son varianzas iguales a 100 y 64,
respectivamente.
a) Determine el intervalo de confianza del 99% para la diferencia de medias.
b) ¿Es válida la afirmación μ1−μ 2=13 ?
13. Un inversionista hacer un estudio sobre los gastos semanales para elegir una de
las dos ciudades, Trujillo o Piura, para un centro comercial. En una muestra de
21 hogares de la ciudad de Trujillo halló : x=$ 400 , s x =$ 210. En otra muestra
de 16 hogares de la ciudad de Piura hallo: y=$ 380 , s y =$ 60 . Suponga
poblaciones normales con varianza desconocidas pero diferentes. Usando un
intervalo de confianza de 95%, ¿En cuál de las dos ciudades debería abrir la
sucursal?
14. El departamento de admisión de una universidad desea estimar la diferencia
entre las medias de las calificaciones de alumnos provenientes de dos
preparatorias. Los resultados de las muestra aleatoria simples e independientes
de las dos escuelas se ven en la siguiente tabla:

Colegio Minerva Colegio Universitario


n1 =26 n2 =20
x 1=18.02 x 2=12.72
s1=0.38 s2=0.45

a) ¿Cuál es el estimado puntual de la diferencia entre las medias de las dos


poblaciones?
b) Determina un intervalo de confianza del 90% para diferencia entre las dos
medias poblacionales. Suponga poblaciones normales con varianza
desconocidas pero diferentes.
15. Se selecciona al azar cinco secretarias de la Universidad de Lima y se procede a
registrar la velocidad en mecanografiar un texto (palabras por minuto) para
cada secretaria. Luego, se les envía a un curso de perfeccionamiento y se
vuelve a realizar la misma prueba. Los resultados obtenidos en ambos casos
son los siguientes:

Secretaria Antes Después


1 80 82
2 70 77
3 85 79
4 62 68
5 82 84

Suponiendo que la característica de estudiar sea normal, se puede estimar con


un 95% de confianza que la velocidad de mecanografiado es superior luego de
haber realizado el curso?
16. El año 1996 se vio caracterizado por el auge de la Bolsa de Valores producto de
las medidas de política económica aplicadas por el gobierno las cuales
promovieron un incremento de rentabilidad relativa de los valores transados
en bolsa respecto de otras alternativas de inversión. Éste fenómeno observado
llega a ser cúspide en el mes de abril de dicho año, periodo en el cual se
transan 576.4 millones de soles entre acciones y obligaciones. A continuación
se presenta un cuadro resumen del movimiento bursátil para 1996 en los
meses de abril y diciembre, respectivamente.

SECTORES ABRIL DICIEMBRE


Bancos 10.8 35.0
Financieras 2.4 9.5
Industriales 267.8 31.1
Mobiliarios 0.0 0.0
Mineras 10.7 6.9
Seguros 2.6 14.8
Servicios públicos 0.1 0.1
Diversas 4.1 27.6
Industrias laborales 113.6 196.2
Mineras laborales 14.0 11.6

Suponiendo que la característica en estudio es normal, ¿Será cierta la


supremacía del mes de abril respecto del mes de diciembre en cuanto al
movimiento bursátil promedio se refiere, aún nivel de confianza del 95%?

Intervalo de confianza para la diferencia de dos proporciones poblacionales

17. Una empresa de estudios de mercado quiere estimar las proporciones de


hombres y mujeres que conocen un producto promocionado a escala nacional.
En una muestra de aleatoria de 100 hombres y 200 mujeres se determina que
20 hombres y 60 mujeres están familiarizados con el artículo indicado.
Construya el intervalo de confianza del 95% para la diferencia de proporciones
de hombres y mujeres que conocen el producto. Con base en los resultados,
¿Se estaría inclinando concluir que existe una diferencia significativa entre las
dos proporciones?
18. En una muestra al azar de 700 mujeres, 300 indican que están a favor de la
ayuda del Estado en los colegios privados. Es una muestra al azar de 400
hombres, 100 indica a favor de lo mismo. Determine un intervalo de confianza
De 90% para la diferencia de proporciones de todas las mujeres y todos
hombres que favorecen tal ayuda.
19. Dos muestras aleatorias de 250 mujeres y 200 hombres indicaban que 75
mujeres y 80 hombres consumieron un nuevo producto unisex que acaba de
salir al mercado. Utilizando un intervalo de confianza del 95%, ¿Se puede
aceptar que es igual la proporción de preferencias de mujeres y hombres en
toda la población? Si no es así, ¿Cuál es la relación?

También podría gustarte