Está en la página 1de 18

Resumen de Inferencia estadstica

Inferencia estadstica
Estudia cmo sacar conclusiones generales para toda la poblacin a partir del estudio de una
muestra, y el grado de fiabilidad o significacin de los resultados obtenidos.

Muestreo
Muestreo probabilstico
Consiste en elegir una muestra de una poblacin al azar. Podemos distinguir varios tipos:

Muestreo aleatorio simple:


Para obtener una muestra, se numeran los elementos de la poblacin y se seleccionan al azar los
n elementos que contiene la muestra.

Muestreo aleatorio sistemtico:


Se elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los dems hasta
completar la muestra.

Muestreo aleatorio estratificado:


Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de individuos
de cada estrato proporcional al nmero de componentes de cada estrato.

EJEMPLO

1.- En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de
actividades de ocio que gustan ms a sus habitantes. Para ello van a ser
encuestados 100 individuos elegidos al azar.
a) Explicar qu procedimiento de seleccin sera ms adecuado utilizar:
muestreo con o sin reposicin. Por qu?
b) Como los gustos cambian con la edad y se sabe que en el barrio viven 2.500
nios, 7.000 adultos y 500 ancianos, posteriormente se decide elegir la muestra
anterior utilizando un muestreo estratificado. Determinar el tamao muestral
correspondiente a cada estrato.

Resolucin:
a) Todas las frmulas que hemos estudiado de teora del muestreo y de
inferencia estadstica presuponen que las poblaciones son infinitas o que, si no
lo son, el muestreo aleatorio se realiza con reposicin.

b) Para efectuar un muestreo aleatorio estratificado, ser necesario que la


muestra refleje fielmente los estratos existentes en la poblacin; deben
considerarse los estratos formados por: nios, adultos y ancianos. El tamao
muestral de cada estrato deber ser proporcional a la presencia del mismo en
la poblacin original:

Poblacin total: 2500 + 7000 + 500 = 10 000.


Con los datos del problema en cada estrato tenemos:
n1 100
= n1 = 25 nios.
2500 10000
n2 100
= n2 = 70 adultos.
7000 10000
n3 100
= n3 = 5 ancianos.
500 10000

INFERENCIA ESTADSTICA 1
2.- En cierta cadena de centros comerciales trabajan 150 personas en el
departamento de personal, 450 en el departamento de ventas, 200 en el
departamento de contabilidad y 100 en el departamento de atencin al cliente.
Con objeto de realizar una encuesta laboral, se quiere seleccionar una muestra
de 180 trabajadores.
a) Qu tipo de muestreo deberamos utilizar para la seleccin de la muestra si
queremos que incluya a trabajadores de los cuatro departamentos mencionados?
b) Qu nmero de trabajadores tendramos que seleccionar en cada
departamento atendiendo a un criterio de proporcionalidad?

a) Utilizaremos un muestreo aleatorio estratificado, ya que queremos que haya


representantes de cada uno de los departamentos.

b) Poblacin total:
N = 150+450+200+100 = 900

Con los datos del problema en cada estrato tenemos:


n1 180
= n1 = 30 trabajadores de personal.
150 900
n2 180
= n2 = 90 trabajadores de ventas.
450 900
n3 180
= n3 = 40 trabajadores de contabilidad.
200 900
n4 180
= n4 = 20 trabajadores de atencin al cliente.
100 900

Estimacin de la media de una poblacin


Teorema central del lmite
Si una poblacin tiene media y desviacin tpica , y tomamos muestras de tamao n (n>30,
cualquier tamao si la poblacin es "normal"), las medias de estas muestras siguen aproximadamente la

distribucin N ,
n

Consecuencias:
 Permite averiguar la probabilidad de que la media de una muestra concreta est en un cierto
intervalo.
 Permite calcular la probabilidad de que la suma de los elementos de una muestra est, a
priori, en un cierto intervalo.
n

x
i =1
i N ,
n

 Inferir la media de la poblacin a partir de una muestra.

EJEMPLO

1.- La variable altura de las alumnas que estudian en una escuela de idiomas
sigue una distribucin normal de media 1,62 m y la desviacin tpica 0,12 m.
Cul es la probabilidad de que la media de una muestra aleatoria de 100
alumnas sea mayor que 1.60 m?

Resolucin:

INFERENCIA ESTADSTICA 2

La distribucin de las medias muestrales sigue una ley N x , ya que el
n
tamao de la muestra n > 30.
0,12
N 1,62; = N(1,62; 0,012)
100
1,60 - 1,62
P(X 1,60) = P Z = P(Z -1,66) = P(Z 1,66) = 0,9515
0,012

2.- Las bolsas de sal envasadas por una mquina tienen = 500 g y = 35 g. Las
bolsas se empaquetaron en cajas de 100 unidades.
a) Calcular la probabilidad de que la media de los pesos de las bolsas de un
paquete sea menor que 495 g.
b) Calcular la probabilidad de que una caja 100 de bolsas pese ms de 51 kg.

Resolucin:

La distribucin de las medias muestrales sigue una ley N x , ya que el
n
tamao de la muestra n > 30.
35
N 500; = N(500; 3,5)
100
495 - 500
P(X 495) = P Z = P (Z -1,43) = P (Z 1,43) = 1-P (Z 1,43) = 0,0764
3,5

b) Para calcular la probabilidad de que una caja 100 de bolsas pese ms de 51 kg.
Suponemos que una bolsa debe pesar, por trmino medio 510 gramos:
510 - 500
P(X 510) = P Z = P(Z 2,86) = 1-P(Z 2,86) = 0,0021
3,5

3.- Sea la poblacin de elementos: {22,24, 26}.


a) Escriba todas las muestras posibles de tamao dos, escogidas mediante
muestreo aleatorio simple.
b) Calcule la varianza de la poblacin.
c) Calcule la varianza de las medias muestrales.

a) Las muestras posibles de tamao dos, escogidas mediante muestreo


aleatorio simple, es decir sin reemplazamiento son:
{(22, 24), (22, 26), (24, 26)}

b) Para calcular la varianza de la poblacin, hallamos antes la media poblacional.


22 + 24 + 26
= = 24
3
Luego la varianza es:
(22 24) 2 + (24 24) 2 + (26 24) 2 8
=
2
=
3 3

c) La media aritmtica de todas las medias muestrales, x , es


23 + 24 + 25
x = = 24
3
La desviacin tpica de todas las medias muestrales, x , es
(23 24) 2 + (24 24) 2 + (25 24) 2 2
2 = =
x 3 3

INFERENCIA ESTADSTICA 3
Estimacin de la proporcin de una poblacin

Se denomina distribucin muestral de proporciones de tamao n, L(P), al conjunto formado por


todas las proporciones de una cierta poblacin P que pose determinada caracterstica p. L(P) se
pq
distribuye segn una ley normal N p, .
n

EJEMPLOS

1.- a) Una mquina produce tornillos, de los cuales se sabe que un 5%


son defectuosos, que se empaquetan en cajas de 400 unidades. Cmo
se distribuye la proporcin de tornillos en las cajas?
b) Calcular la probabilidad de que la proporcin de los tornillos
defectuosos de una caja determinada sea mayor que el 7%.

Resolucin:
a) Como la proporcin de tornillos defectuosos es p = 0,05 y el tamao de la
muestra es n = 400, la distribucin es de tipo normal siendo:
p = p = 0,05
pq 0,05.(1 - 0,05)
p = = = 0,0011
n 400
Es decir la distribucin normal N(0,05; 0,011)

0,07 - 0,05
b) P(X 0,07) = P Z = P(Z 1,82) = 1-P(Z 1,82) = 0,0344
0,011

3.- Una poblacin est formada por 3 elementos, con valores 1, 2 y 3.


a) Escribe todas las muestras simples de tamao 2 que pueden extraerse.
b) Calcula la media y desviacin tpica de la distribucin muestral de
proporciones de cifras impares.

Resolucin:
a) Las muestras simples de tamao 2 son {(1,2), (1,3), (2,3)}

b) La distribucin muestral de proporciones de cifras impares es {1/2, 1, 1/2}.


La media y la desviacin tpica son:
0,5 + 1 + 0,5 2
p = p = =
3 3

(0,5 - 2/3) 2 + (1 - 2/3) 2 + (0,5 - 2/3) 2 1


p = =
3 6

Intervalos caractersticos
 El nivel de confianza (p) se designa mediante 1 - .
 El nivel de significacin se designa mediante .
 El valor crtico (k) como z /2 .
P(Z>z /2) = /2 P[-z /2 < z < z /2] = 1-
En una distribucin N(, ) el intervalo caracterstico correspondiente a una probabilidad p = 1 -
es: ( - z /2 , + z /2 )

INFERENCIA ESTADSTICA 4
1- /2 z /2 Intervalos caractersticos
0.90 0.05 1.645 ( - 1.645 , + 1.645 )
0.95 0.025 1.96 ( - 1.96 , + 1.96 )
0.99 0.005 2.575 ( - 2.575 , + 2.575 )

Estimacin de la media
 Intervalo de confianza para la media
El intervalo de confianza, para la media de una poblacin, con un nivel de confianza de 1- ,
siendo x la media de una muestra de tamao n y la desviacin tpica de la poblacin, es:

- Z /2 , + Z /2
n n
 El error mximo de estimacin es:

E = Z /2
n
 Tamao de la muestra:
2
Z
n = /2
E

EJEMPLO

1.- Se ha tomado una muestra de los precios de un mismo producto alimenticio


en 16 comercios, elegidos al azar en un barrio de una ciudad, y se han
encontrado los siguientes precios:
95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110.
Suponiendo que los precios de este producto se distribuyen segn una ley
normal de varianza 25 y media desconocida:
a) Cul es la distribucin de la media muestral?
b) Determine el intervalo de confianza, al 95%, para la media poblacional.

Resolucin:
a)La media muestral es:
95 + 108 + 97 + 112 + 99 + 106 + 105 + 100 + 99 + 98 + 104 + 110 + 107 + 111 + 103 + 110
x= = 104
16

b) Para un nivel de confianza del 95% tenemos que 1- = 0,95, /2 = 0,025,


luego Z/2 = 1,96 pues P(X<1,96) = 0,975.
El intervalo de confianza es:
5 5
x - Z /2 , x + Z /2 = 104 - 1,96 ,104 + 1,96 = (101.55; 106.45)

n n 16 16

2.- La media de las estaturas de una muestra aleatoria de 400 personas de una
ciudad es 1,75 m. Se sabe que la estatura de las personas de esa ciudad es una
2
variable aleatoria que sigue una distribucin normal con varianza 2 = 0,16 m .
a) Construye un intervalo, de un 95% de confianza, para la media de las estaturas
de la poblacin.
b) Cul sera el mnimo tamao muestral necesario para que pueda decirse que
la verdadera media de las estaturas est a menos de 2 cm de la media muestral,
con un nivel de confianza del 90%?

INFERENCIA ESTADSTICA 5
Resolucin:
a) Para un nivel de confianza del 95% tenemos que 1- = 0,95, /2 = 0,025,
luego Z/2 = 1,96 pues P(X<1,96) = 0,975.
El intervalo de confianza es:
0,4 0,4
x - Z /2 , x + Z /2 = 1,75 - 1,96 ; 1,75 + 1,96 = (1.7108,1.7892)

n n 400 400

b) Para un nivel de confianza del 90% tenemos que 1- = 0,90, /2 = 0,05,


luego Z/2 = 1,65 pues P(X<1,65) = 0,9500.
Como el margen de error es:
0,4 0,4
E = Z /2 0,02 = 1,65 n = 1,65 = 32,9 n = 1082,41
n n 0,02
La muestra debe tener al menos 1083 personas.

Estimacin de una proporcin


Si en una poblacin, una determinada caracterstica se presenta en una proporcin p, la
proporcin P, de individuos con dicha caracterstica en las muestras de tamao n, se distribuirn segn:
PQ
N P,
n

 Intervalo de confianza para una proporcin:

P - Z /2 PQ , P + Z /2 PQ
n n

 El error mximo de estimacin es:

pq
E = Z /2
n
 Tamao de la muestra:
2
Z
n = pq /2
E

EJEMPLO

1.- En una muestra de 300 personas tomadas al azar en una ciudad se


encontr que 104 de ellas lean el peridico. Halla, con un nivel de
confianza del 90%, la proporcin de habitantes que leen el peridico y el
error mximo admisible para la proporcin de habitantes que leen el
peridico

Resolucin:
Una confianza del 90% significa que 1- = 0,10, luego /2 = 0,050, luego
tenemos Z/2 = 1,645 pues P(X < 1,645) = 0,95.
104
La proporcin muestral es p = = 0,347.
300

a) Como la muestra n = 104 > 30 podemos sustituir la proporcin poblacional


por la muestral y el intervalo de confianza es:

0,347 - 1,645 0,347.0653 ; 0,347 + 1,645 0,347.0653 = (0,302; 0,392)
300 300

INFERENCIA ESTADSTICA 6
b) El error mximo admisible es:
pq 0,347.0,65 3
E = Z /2 = 1645
, = 0,045
n 300

2.- Se desea estimar la proporcin, p, de individuos daltnicos de una


poblacin a travs del porcentaje observado en una muestra aleatoria de
individuos, de tamao n.
a) Si el porcentaje de individuos daltnicos en la muestra es igual al 30%,
calcula el valor de n para que, con un nivel de confianza de 0,95, el error
cometido en la estimacin sea inferior al 3,1%.
b) Si el tamao de la muestra es de 64 individuos, y el porcentaje de
individuos daltnicos en la muestra es del 35%, determina, usando un
nivel de significacin del 1%, el correspondiente intervalo de confianza
para la proporcin de daltnicos de la poblacin.

Resolucin:
a) Para un nivel de confianza del 95% tenemos que 1- = 0,95, /2 = 0,025,
luego Z/2 = 1,96 pues P(X<1,96) = 0,975.
Sustituyendo en la expresin del error mximo admisible:
2
pq 0,3.0,7 1,96
E = Z /2 1,96 = 0,031 n = 0,3.0,7. = 839, 48
n n 0,031
Habr que tomar al menos 840 individuos.

b) Para un nivel de significacin del 1% tenemos un nivel de confianza del


99%, es decir, 1- = 0,99, /2 = 0,005, luego Z/2 = 2,575 pues P(X<2,575) =
0,995.

0,35 - 2,575 0,35.065 ; 0,35 + 2,575 0,35.065 = (0,196; 0,504)
64 64

Contrastes de hiptesis
Hiptesis estadsticas
Un test estadstico es un procedimiento para, a partir de una muestra aleatoria y significativa,
extraer conclusiones que permitan aceptar o rechazar una hiptesis previamente emitida sobre el valor
de un parmetro desconocido de una poblacin.
La hiptesis emitida se designa por H0 y se llama hiptesis nula.
La hiptesis contraria se designa por H1 y se llama hiptesis alternativa.

Contrastes de hiptesis
1. Enunciar la hiptesis nula H0 y la alternativa H1.

Bilateral H0=k H1 k

H 0 k H1 < k
Unilateral
H0 k H 1> k

2. A partir de un nivel de confianza 1 - o el de significacin . Determinar:


El valor z/2 (bilaterales), o bien z (unilaterales)
La zona de aceptacin del parmetro muestral (x o P).
3. Calcular: x o P, a partir de la muestra.

INFERENCIA ESTADSTICA 7
4. Si el valor del parmetro muestral est dentro de la zona de la aceptacin, se acepta la
hiptesis con un nivel de significacin . Si no, se rechaza.

Contraste Bilateral
Se presenta cuando la hiptesis nula es del tipo H0: = k (o bien H0: p = k) y la hiptesis
alternativa, por tanto, es del tipo H1: k (o bien H1: p k).

El nivel de significacin se concentra en dos partes (o colas) simtricas respecto de la


media.
La regin de aceptacin en este caso no es ms que el correspondiente intervalo de probabilidad
para x o P, es decir:

- Z /2 , + Z /2
n n
o bien:

P - Z /2 PQ , P + Z /2 PQ
n n

EJEMPLO

1.- Se sabe que la desviacin tpica de las notas de cierto examen de


Matemticas es 2,4. Para una muestra de 36 estudiantes se obtuvo una
nota media de 5,6. Sirven estos datos para confirmar la hiptesis de que
la nota media del examen fue de 6, con un nivel de confianza del 95%?

Resolucin:
1. Enunciamos las hiptesis nula y alternativa:
H0 : = 6 La nota media no ha variado.
H1 : 6 La nota media ha variado.

2. Zona de aceptacin
Para = 0.05, le corresponde un valor crtico: z/2 = 1.96.
Determinamos el intervalo de confianza para la media:
(6-1,96 0,4 ; 6+1,96 0,4) = (5,22 ; 6,78)

3. Verificacin.
Valor obtenido de la media de la muestra: 5,6.

4. Decisin
Aceptamos la hiptesis nula H0, con un nivel de significacin del 5%.

2.- Un fabricante de lmparas elctricas est ensayando un nuevo mtodo de


produccin que se considerar aceptable si las lmparas obtenidas por este
mtodo dan lugar a una poblacin normal de duracin media 2400 horas, con una
desviacin tpica igual a 300. Se toma una muestra de 100 lmparas producidas

INFERENCIA ESTADSTICA 8
por este mtodo y esta muestra tiene una duracin media de 2320 horas. Se
puede aceptar la hiptesis de validez del nuevo proceso de fabricacin con un
riesgo igual o menor al 5%?

Resolucin:
1 Enunciamos las hiptesis nula y alternativa:
H0 : = 2400
H1 : 2400

2 Zona de aceptacin
= 0.05 z = 1.96.
Determinamos el intervalo de confianza para la media:
300 300
2400 1,96 , 2400 + 1,96 = (2341,1; 2458,8)
100 100

3 Verificacin.
Valor obtenido de la media de la muestra: 2320.

4 Decisin
Rechazamos la hiptesis nula H0, con un nivel de significacin del 5%.

3.- Se cree que el nivel medio de protombina en una poblacin normal es de 20


mg/100 ml de plasma con una desviacin tpica de 4 miligramos/100 ml. Para
comprobarlo, se toma una muestra de 40 individuos en los que la media es de
18.5 mg/100 ml. Se puede aceptar la hiptesis, con un nivel de significacin del
5%?

Resolucin:
1 Enunciamos las hiptesis nula y alternativa:
H0 : =20 mg/100 ml
H1 : 20 mg/100 ml

2 Zona de aceptacin
Para = 0.05, le corresponde un valor crtico: z/2 = 1.96.
Determinamos el intervalo de confianza para la media:
4 4
20 1,96 , 20 + 1,96 = (18,77; 21,23)
40 40

3 Verificacin.
Valor obtenido de la media de la muestra: 18.5.

4 Decisin
Rechazamos la hiptesis nula H0, con un nivel de significacin del 5%.

Contraste unilateral

Caso 1
La hiptesis nula es del tipo H0: k (o bien H0: p k).
La hiptesis alternativa, por tanto, es del tipo H1: < k (o bien H1: p < k).

Valores crticos
1- z
0.90 0.10 1.28

INFERENCIA ESTADSTICA 9
0.95 0.05 1.645
0.99 0.01 2.33

El nivel de significacin se concentra en una parte o cola.


La regin de aceptacin en este caso ser:

- Z/2 ,
n
o bien:

P - Z/2 PQ ,
n

EJEMPLO

1.- Un socilogo ha pronosticado, que en una determinada ciudad, el


nivel de abstencin en las prximas elecciones ser del 40% como
mnimo. Se elige al azar una muestra aleatoria de 200 individuos, con
derecho a voto, 75 de los cuales estaran dispuestos a votar. Determinar
con un nivel de significacin del 1%, si se puede admitir el pronstico.

Resolucin:
1. Enunciamos las hiptesis nula y alternativa:
H0 : p 0.40 La abstencin ser como mnimo del 40%.
H1 : p < 0.40 La abstencin ser como mximo del 40%;

2. Zona de aceptacin
Para = 0.01, le corresponde un valor crtico: z = 2.33.
Determinamos el intervalo de confianza para la media:

0,4 - 2,33 0,4.06 , = (0,3192; )
200

3. Verificacin.
125
P= = 0,625
200

4. Decisin
Aceptamos la hiptesis nula H0. Podemos afirmar, con un nivel de significacin del
1%, que la La abstencin ser como mnimo del 40%.

2.- La duracin de la bombillas de 100 W que fabrica una empresa sigue una
distribucin normal con una desviacin tpica de 120 horas de duracin. Su vida
media est garantizada durante un mnimo de 800 horas. Se escoge al azar una
muestra de 50 bombillas de un lote y, despus de comprobarlas, se obtiene una

INFERENCIA ESTADSTICA 10
vida media de 750 horas. Con un nivel de significacin de 0,01, habra que
rechazar el lote por no cumplir la garanta?

Resolucin:
1 Enunciamos las hiptesis nula y alternativa:
H0 : 800
H1 : <800

2 Zona de aceptacin
= 0.01; z = 2.33
Determinamos el intervalo de confianza:
120
800 2,33 , = (760,46, )
50

3 Verificacin.
x = 750

4 Decisin
Rechazamos la hiptesis nula H0. Con un nivel de significacin del 1%.

3.- El control de calidad una fbrica de pilas y bateras sospecha que hubo
defectos en la produccin de un modelo de batera para telfonos mviles,
bajando su tiempo de duracin. Hasta ahora el tiempo de duracin en
conversacin segua una distribucin normal con media 300 minutos y
desviacin tpica 30 minutos. Sin embargo, en la inspeccin del ltimo lote
producido, antes de enviarlo al mercado, se obtuvo que de una muestra de 60
bateras el tiempo medio de duracin en conversacin fue de 290 minutos.
Suponiendo que ese tiempo sigue siendo Normal con la misma desviacin tpica:
Se puede concluir que las sospechas del control de calidad son ciertas a un
nivel de significacin del 2%?

Resolucin:
1 Enunciamos las hiptesis nula y alternativa:
H0 : 300
H1 : < 300

2 Zona de aceptacin
= 0.02; 1- = 0. 98; P(1.96)= 0. 98; z = 1.96 .
Determinamos el intervalo de confianza:
30
300 2,33 , = (290,98, )
60

3 Verificacin.
= 290

4 Decisin
Rechazamos la hiptesis nula H0. Con un nivel de significacin del 2%.

Caso 2
La hiptesis nula es del tipo H0: k (o bien H0: p k).
La hiptesis alternativa, por tanto, es del tipo H1: > k (o bien H1: p > k).

INFERENCIA ESTADSTICA 11
El nivel de significacin se concentra en la otra parte o cola.

La regin de aceptacin en este caso ser:



, + Z /2
n
o bien:

, P + Z /2 PQ
n

EJEMPLO

1.- Un informe indica que el precio medio del billete de avin entre
Canarias y Madrid es, como mximo, de 120 con una desviacin tpica
de 40 . Se toma una muestra de 100 viajeros y se obtiene que la media
de los precios de sus billetes es de 128 .
Se puede aceptar, con un nivel de significacin igual a 0,1, la afirmacin
de partida?

Resolucin:
1. Enunciamos las hiptesis nula y alternativa:
H0 : 120
H1 : > 120

2. Zona de aceptacin
Para = 0.1, le corresponde un valor crtico: z = 1.28 .
Determinamos el intervalo de confianza:
40
, 120 + 1,28 = (-; 125,12)
100

3. Verificacin.
Valor obtenido de la media de la muestra: 128 .

4. Decisin
No aceptamos la hiptesis nula H0. Con un nivel de significacin del 10%.

2.- Una marca de nueces afirma que, como mximo, el 6% de las nueces estn
vacas. Se eligieron 300 nueces al azar y se detectaron 21 vacas.
a) Con un nivel de significacin del 1%, se puede aceptar la afirmacin de la
marca?
b) Si se mantiene el porcentaje muestral de nueces que estn vacas y 1- = 0.95,
qu tamao muestral se necesitara para estimar la proporcin de nueces con
un error menor del 1% por ciento?

Resolucin:
a) 1 Enunciamos las hiptesis nula y alternativa:
H0 : p 0.06

INFERENCIA ESTADSTICA 12
H1 : p >0.06

2 Zona de aceptacin
= 0.01 z = 2.33.
Determinamos el intervalo de confianza:

, 0,06 + 2,33 0,06.0,94 = (-; 0,092)
300

3 Verificacin.
21
P= = 0,07
300

4 Decisin
Aceptamos la hiptesis nula H0. Con un nivel de significacin del 1%.

b) Tenemos que:
1 - = 0, 95 Z/2 = 1, 96
0,07.0,93
0,01 = 1,96 n = 50 n = 2500
n
Luego:
n 2501

Errores de tipo I y tipo II

 Error de tipo I. Se comete cuando la hiptesis nula es verdadera y, como consecuencia del
contraste, se rechaza.
 Error de tipo II. Se comete cuando la hiptesis nula es falsa y, como consecuencia del
contraste se acepta.
H0 Verdadera Falsa

Decisn correcta Decisin incorrecta:


Aceptar
Probabilidad = 1 - ERROR DE TIPO II

ERROR DE TIPO I
Rechazar Decisin correcta
Probabilidad =

La probabilidad de cometer Error de tipo I es el nivel de significacin .


La probabilidad de cometer Error de tipo II depende del verdadero valor del parmetro. Se hace
tanto menor cuanto mayor sea n.

INFERENCIA ESTADSTICA 13
Relacin de Ejercicios de Contrastes de Hiptesis.
Ponencia Andaluza de Matemticas Aplicadas a las Ciencias Sociales II.

1. La altura en cm. de las caas producidas por una variedad de carrizo en cada cosecha es una variable
aleatoria que sigue una ley normal con desviacin tpica a = 16 cm. Para contrastar si la altura media
de las caas de la ltima cosecha es de 170 cm, se ha tomado una muestra aleatoria de 64 de estas
canas y se han medido sus longitudes, resultando como media muestral x = 166 cm.
Son suficientes estos datos para rechazar que la altura media de las caas de la ltima cosecha es de
170 cm, a un nivel de significacin = 0,05?
Solucin: Estos datos son suficientes para rechazar, a este nivel, que la altura media de las caas de
esta cosecha sea de 170 cm.

2. Un comerciante ha observado durante un largo periodo de tiempo que sus beneficios semanales se
distribuyen segn una ley normal con una media de 5000 euros y una desviacin tpica de 520 euros. A
finales del ao pasado se abri un supermercado frente a su comercio y l cree que su beneficio
semanal medio ha disminuido desde entonces. Para contrastar esta suposicin, ha tomado una muestra
aleatoria de 16 semanas del ao actual y ha encontrado que el beneficio semanal medio de esa muestra
es de 4700 euros. Puede afirmarse, a un nivel de significacin = 0, 01, que estos datos avalan la
creencia del comerciante?
Solucin: No se puede afirmar, al nivel 0,01, que los datos de la muestra apoyan la creencia de que el
nuevo supermercado ha disminuido el beneficio semanal medio del comerciante.

3. Solo el 75 % de los alumnos de un centro de enseanza realizan correctamente un test psicotcnico


que lleva utilizndose mucho tiempo. Para tratar de mejorar este resultado, se modific la redaccin
del test, y se propuso a un grupo de 120 alumnos de ese centro, elegidos al azar. De los 120 alumnos a
los que se les paso el nuevo test, lo realizaron correctamente 107. Podemos afirmar que la nueva
redaccin del test ha aumentado la proporcin de respuestas correctas, a un nivel de significacin =
0,025?
Solucin: Podemos afirmar que la nueva redaccin del test ha aumentado la proporcin de respuestas
correctas, a un nivel de significacin = 0,025.

4. El peso en vaco de los envases fabricados por una empresa, segn su mtodo usual, es una variable
aleatoria que sigue una ley normal con media 20 gramos y una desviacin tpica de 1 gramo.
Se desea contrastar si un nuevo proceso de fabricacin no aumenta dicho peso medio. Para ello, se
eligen al azar 25 envases fabricados por la nueva tcnica y se encuentra que la media de su peso en
vaco es de 20,5 gramos.
Se puede afirmar, a un nivel de significacin a = 0,02, que el nuevo proceso ha aumentado el peso
medio de los envases?
Solucin: A la vista de los datos obtenidos en la muestra, se puede afirmar, al nivel = 0,02, que el
nuevo proceso ha aumentado el peso medio de los envases.

5. En unas elecciones municipales de una ciudad, el 42 % de los votantes dieron su voto al partido A. En
una encuesta realizada un ao despus a 500 personas con derecho a voto, solo 184 votaran al partido
A. Con estos datos, puede afirmarse que ha disminuido la proporcin de votantes a ese partido?
Responder a la pregunta anterior con niveles de significacin = 0,01, = 0,025 y = 0,001.
Solucin: Los datos permiten afirmar que ha disminuido la proporcin de votantes al partido A a los
niveles 0,025 y 0,01, pero no ha disminuido la proporcin al nivel 0,001.

6. En una ciudad, donde la proporcin de fumadores con edad comprendida entre 18 y 20 aos es del 30
%, el ayuntamiento ha realizado una campaa contra el consumo de tabaco. Dos meses despus de
terminar dicha campaa, se ha realizado una encuesta a 400 personas de estas edades, elegidas al azar,
y se ha encontrado entre ellos a 92 fumadores. Podemos afirmar, a un nivel de significacin =
0,05, que esta campaa ha modificado la proporcin de fumadores entre 18 y 25 aos?
Solucin: Estos datos son suficientes para afirmar, al nivel 0,05, que se ha modificado la proporcin
de fumadores entre los 18 y 25 anos.

7. Un fabricante de automviles produce dos tipos de un determinado modelo de turismo: el tipo A, con
motor de gasolina, y el tipo B, con motor de gasoil. De una muestra aleatoria de 200 turismos de este

INFERENCIA ESTADSTICA 14
modelo, 112 son del tipo B. Proporcionan estos datos suficiente evidencia, a un nivel de significacin
= 0,01, de que los clientes prefieren el modelo del tipo B al del tipo A?
Solucin: No tenemos evidencias suficientes para afirmar que los clientes prefieren el modelo del tipo
B de gasoil, al del tipo A de gasolina, al nivel de significacin = 0,01.

8. Supongamos que 100 neumticos de cierta marca duraron en promedio 21431 kilmetros. Si se supone
que la poblacin es normal con una desviacin tpica poblacional de 1295 km, utilizando = 0,05,
podemos considerar que la duracin media de los neumticos es inferior a 22000 km?
Solucin: Podemos afirmar que la duracin media de los neumticos de dicha marca es menor de
22000 Km., con una probabilidad de error tipo I, , del 5 %.

9. Un constructor afirma que por lo menos el 75% de las casas que construye tienen calefaccin. Se
estara de acuerdo con tal afirmacin si una inspecciona aleatoria muestra que 72 de 135 casas cuentan
con calefaccin? (Usar = 0,1 )
Solucin: Los datos de la muestra son suficientes para rechazar, a este nivel = 0,1, la afirmacin
del constructor de que la proporcin de casas con calefaccin que ste construye no es inferior al
75%.

10. Una compaa textil afirma que a lo sumo el 20 % del pblico compra ropa de lana. Verifica esta
afirmacin para = 0,01 , si una encuesta aleatoria indica que 46 de 200 clientes compran ropa de
lana.
Solucin: Los datos de la muestra no son suficientes para rechazar, a este nivel, que la proporcin del
pblico que compra ropa de lana no supera el 20 %.

11. Se sabe que la longitud en cm de una determinada especie de colepteros sigue una distribucin
normal de varianza 0,25 cm2. Capturados 6 ejemplares de dicha especie, sus longitudes (en cm)
fueron: 2,75 1,72 2,91 2,6 2,64 3,34 Se puede aceptar la hiptesis de que la poblacin tiene una
longitud media de 2,656 cm? (Usar = 0,05 )
Solucin: No tenemos evidencias suficientes para rechazar que la longitud media de esa especie de
colepteros es de 2.656 cm, con una probabilidad de error tipo I, , del 5 %.

12. La edad de la poblacin que vive en residencias de mayores en Cdiz sigue una distribucin normal
de desviacin tpica 7,3 aos. Se toma una muestra aleatoria simple de tamao 50, y se obtiene una
media muestral de 69 anos. Se puede asegurar que la edad media de la poblacin que vive en
residencias de mayores en Cdiz es mayor de 70 aos con un nivel de significacin del 5 %?
Solucin: Puede decirse que los datos de la muestra no permiten afirmar que la media de edad de
esas personas sea mayor que 70 aos, al nivel de significacin = 0,05.

13. Para conocer la produccin media de sus olivos, un olivarero escoge al azar 10 de ellos, pesa su
produccin de aceitunas, y obtiene los siguientes valores, expresados en Kg.: 175, 180, 210, 215,
186, 213, 190, 213, 184, 195. Sabemos que la produccin sigue una distribucin normal con
desviacin tpica igual a 15.3 Kg. Con la informacin obtenida, se puede asegurar que la produccin
media de un olivo de ese agricultor es menor de 200 Kg? (Usar = 0,05 )
Solucin: Puede decirse que los datos de la muestra confirman que la produccin media de un olivo
de ese agricultor es menor de 200 Kg., al nivel de significacin = 0,05.

14. El 40 % de los escolares de cierto pas suelen perder al menos un da de clase a causa de gripes y
catarros. Sin embargo, un estudio sobre 1000 escolares revela que en el ltimo curso hubo 450 en
tales circunstancias. Las autoridades defienden que el porcentaje del 40% para toda la poblacin de
escolares se ha mantenido. Contrastar con un nivel de significacin del 5 % la hiptesis defendida
por las autoridades sanitarias, frente a que el porcentaje ha aumentado, como parecen indicar los
datos, explicando claramente a que conclusin se llega.
Solucin: Estos datos son suficientes para afirmar, al nivel = 0,05, que el porcentaje de escolares
que pierden al menos un da de clase por causa de gripes y catarros ha aumentado, por lo que ese
porcentaje es mayor del 40 %. Entonces, la hiptesis mantenida por las autoridades no es correcta.

15. Una de las entradas a cierta ciudad andaluza sufra constantemente retenciones de trfico, de forma
que el tiempo de espera en la cola formada por el semforo all instalado segua una distribucin
Normal de media 10 minutos y desviacin tpica 4 minutos. Con el fin de descongestionar ese punto

INFERENCIA ESTADSTICA 15
y bajar la media de tiempo de espera, se habilito una va de acceso auxiliar. Transcurrida una semana
se hizo un estudio sobre 36 vehculos y se obtuvo que el tiempo medio de espera en el citado
semforo fue de 8.5 minutos. Las autoridades municipales mostraron su satisfaccin y dijeron que la
medida haba funcionado, pero la opinin pblica, sin embargo, defiende que la situacin sigue igual.
Suponiendo que la desviacin tpica se ha mantenido:
a) Plantee un test para contrastar la hiptesis defendida por la opinin pblica frente a la de los
responsables municipales. Si se concluye que la media de tiempo de espera baj y realmente no
lo hizo, como se llama el error cometido?
b) A que conclusin se llega con un nivel de significacin del 5 %?
c) A que conclusin se llega con un nivel de significacin del 1 %?
Solucin: a) El error se denomina Error tipo I, y la probabilidad de cometer un error de tipo I se
denomina . Estos datos son suficientes para afirmar, al nivel = 0,05, que el tiempo medio de
espera en dicho semforo ha bajado, por lo que ese tiempo de espera es ahora menor de 10
minutos. Entonces, la hiptesis mantenida por las autoridades municipales es correcta, y la medida
de habilitar una va de acceso auxiliar ha descongestionado el trafico en la entrada de dicha
ciudad. Sin embargo, para un nivel = 0,01 no se puede rechazar la hiptesis nula, y por tanto el
tiempo medio de espera en el semforo sigue siendo de 10 minutos.

16. En un hospital se observ que los pacientes abusaban del servicio de urgencias, de forma que un 30
% de las consultas podan perfectamente haber esperado a concertar una cita con el medico de
cabecera, porque no eran realmente urgencias. Puesto que esta situacin ralentizaba el servicio, se
realizo una campaa intensiva de concienciacin. Transcurridos unos meses se ha recogido
informacin de 120 consultas al servicio, de las cuales slo 30 no eran realmente urgencias:
a) Hay personal del hospital que defiende que la campaa no ha mejorado la situacin. Plantee un
test para contrastar esta hiptesis frente a que s la mejoro. Si se concluye que la situacin no ha
mejorado y realmente s lo hizo, cmo se llama el error cometido?
b) A qu conclusin se llega en el test planteado en el apartado anterior con un nivel de
significacin del 1%?
Solucin: a) El error se denomina Error tipo II. b) La campaa de concienciacin no ha reducido
el porcentaje de pacientes (30%) que abusan del servicio de urgencias, al nivel de significacin
= 0, 01.

17. El alcalde de una ciudad prometi, en su programa electoral, oponerse a la construccin de una
central de tratamiento de ciertos residuos, puesto que en aquel momento solo un 10 % de los
ciudadanos estaban a favor de la central de tratamiento de residuos. En los ltimos das se ha
encuestado a 100 personas de las cuales 14 estn a favor de la central. El alcalde afirma sin embargo
que el porcentaje de ciudadanos a favor sigue siendo del 10 % o incluso ha disminuido. Tiene razn
el alcalde con un nivel de significacin del 2 %?
Solucin: No tenemos evidencias suficientes para afirmar que el porcentaje de ciudadanos que
estaran a favor de la construccin de la central de tratamiento de residuos es mayor del 10 %, al
nivel de significacin = 0,02. Por tanto, los datos de la muestra avalan la opinin del alcalde de
que el porcentaje de ciudadanos a favor sigue siendo del 10 % o incluso ha disminuido.

18. Se desea estudiar el gasto mensual de los telfonos mviles, en euros, de los estudiantes
universitarios andaluces. Para ello, se ha elegido una muestra aleatoria de 10 de estos estudiantes,
resultando los valores siguientes para el gasto mensual en mvil:
30 60 25 20 25 30 35 45 50 40

Se supone que la variable aleatoria objeto de estudio sigue una distribucin normal de media
desconocida y de desviacin tpica igual a 12 euros.
a) Se puede asegurar que los estudiantes universitarios andaluces gastan menos de 50 euros
mensuales en telfono Mobil? (Usar = 0,01)
b) Cul es la desviacin tpica de la media muestral?
Solucin: a) Estos datos son suficientes para afirmar, al nivel = 0,01, que los estudiantes
universitarios andaluces gastan menos de 50 euros al mes en telfono mvil. b) La desviacin tpica
de la media muestral es = 3,795.

INFERENCIA ESTADSTICA 16
19. Una mquina de envasado automtico llena en cada saco una cierta cantidad de determinado
producto. Se seleccionan 20 sacos, se pesa su contenido y se obtienen los siguientes resultados (en
kilos):
49, 50,49, 50, 50, 50,49, 50, 50, 50, 49, 50, 50, 51, 52, 48, 50, 51, 51, 51
A partir de esta informacin y suponiendo que la variable, peso de cada saco, se distribuye
normalmente con desviacin tpica 1 Kg.:
a) Se puede admitir que el peso medio de los sacos que llena la maquina es de aproximadamente
51 kg? (Usar a = 0,01)
b) Se puede admitir que el peso medio de los sacos que llena la maquina es menor de 50 Kg? (Usar
= 0,05)
Solucin: a) Podemos afirmar que la maquina no envasa sacos de aproximadamente 51 kg, al nivel
de significacin = 0, 01. b) Podemos decir que los mismos datos apoyan la hiptesis de que el
peso medio de los sacos no es inferior a los 50 Kg, al nivel de significacin = 0,05.

20. El consumo de cierto producto sigue una distribucin normal con varianza 300. A partir de una
muestra de tamao 25 se ha obtenido una media muestral igual a 180.
a) Halle un intervalo de confianza al 95 % para la media del consumo.
b) Se podra afirmar que el consumo medio de este producto no llega a 200? (Usar = 0,05)
Solucin a) Un intervalo de confianza al 95% para la media del consumo es (173,21; 186,79).
b) Los datos de esta muestra permiten afirmar que el consumo medio de este producto no llega a
200, al nivel de significacin = 0,05.

21. Los estudiantes universitarios de cierto pas dedican al estudio un nmero de horas semanales que
sigue una distribucin normal de media desconocida y de desviacin tpica 7 horas. Si en una
muestra de 200 estudiantes se obtuvo una media muestral de 30 horas de estudio semanal.
a) Halle un intervalo de confianza al 95 % para el nmero de horas de estudio semanales de los
estudiantes universitarios de dicho pas.
b) Se podra afirmar que los estudiantes universitarios de ese pas estudian menos de 35 horas
semanales? (Usar = 0,01)
Solucin: a) Un intervalo de confianza al 95 % para la media de horas de estudio semanales de los
universitarios es (29,03; 30,97).
b) Podemos afirmar que la media del nmero de horas de estudio semanales de los universitarios es
menor de 35 horas, al nivel de significacin = 0,01.

22. La talla de los individuos de una poblacin sigue una distribucin normal de desviacin tpica 8 cm.
Se han determinado las tallas de 25 individuos, encontrndose una media de 168 cm. Se podra
afirmar que la talla media de la poblacin es menor de 170 cm? (Usar = 0,03)
Solucin: No tenemos evidencias suficientes para afirmar que la talla media de la poblacin es
menor de 170 cm, al nivel de significacin = 0,03.

23. Los estudiantes de Bachillerato de una cierta comunidad autnoma duermen un nmero de horas
diarias que se distribuye segn una ley normal de media desconocida y desviacin tpica 3 horas. A
partir de una muestra aleatoria de tamao 30 se ha obtenido una media igual a 7 horas. Se podra
afirmar que el nmero medio de horas de sueo de los estudiantes de Bachillerato de dicha
comunidad autnoma es mayor de 6 horas? (Usar = 0,04)
Solucin: En consecuencia, a este nivel = 0,04, los datos de la muestra permiten afirmar que el
numero medio de horas de sueno de los estudiantes de Bachillerato de dicha comunidad autnoma
es mayor de 6 horas.

24. Las autoridades educativas publican en un estudio que el 25 % de los estudiantes de Bachillerato de
una cierta comunidad autnoma tienen ordenador porttil. A partir de una muestra aleatoria de
tamao 300 se ha obtenido que solo 70 de ellos tienen ordenador porttil. Se podra asegurar que las
autoridades dicen la verdad? (Usar = 0,06)
Solucin: No tenemos evidencias suficientes para afirmar que el porcentaje de estudiantes de
Bachillerato que tienen ordenador porttil es distinto del 25%, al nivel de significacin = 0,06.
En consecuencia, a este nivel, los datos no permiten rechazar que el estudio se corresponda con la
realidad. Por tanto, podemos afirmar que las autoridades educativas dicen la verdad.

INFERENCIA ESTADSTICA 17
25. Un laboratorio farmacutico fabrica un producto para la cada del cabello que envasa en botes, y en el
etiquetado indica que su contenido aproximado es de 100 c.c. Se eligen, al azar, 7 de estos botes y se
miden sus contenidos dando el siguiente resultado (en c.c.):
97 101 102 99 98 100 103
Podemos asegurar que la capacidad media de los botes que se fabrican es la indicada en el bote?
(Usar = 0,01) (Se sabe que el contenido es una variable aleatoria normal de desviacin tpica 2
c.c.)
Solucin: Podemos asegurar que la capacidad media de los botes que se fabrican es la indicada en
la etiqueta (100 c.c.), al nivel de significacin = 0,01.

26. Se ha tomado una muestra de precios de un mismo producto en 16 comercios, elegidos al azar en una
ciudad, y se han encontrado los siguientes precios (en euros):
95,108, 97,112, 99,106,105,100, 99, 98,104,110,107,111,103,110.

Suponiendo que los precios de este producto se distribuyen segn una ley normal de varianza 25 y
media desconocida:
a) Cual es la distribucin de la media muestral?
b) Se puede afirmar que el precio medio de dicho producto es menor de 105 euros? (Usar = 0,03)
Solucin: a) La distribucin de la media muestral sigue una ley Normal con media desconocida (la
misma que la media de la poblacin) y desviacin tpica = 5/4 = 1,25.
b) No tenemos evidencias suficientes para afirmar que el precio medio de dicho producto en esa
ciudad es menor de 105 euros, al nivel de significacin = 0,03.

27. Los alumnos de preescolar de Andaluca tienen una estatura que es una variable aleatoria de media
desconocida y desviacin tpica 16 cm. Si seleccionamos una muestra aleatoria de 100 de tales
alumnos y obtenemos una estatura media de 95 cm,
a) se puede afirmar que la estatura media de los alumnos de preescolar de Andaluca es menor de
95 cm? (Usar = 0,01)
b) se puede afirmar que la estatura media de los alumnos de preescolar de Andaluca es mayor de
100 cm? (Usar = 0,05)
Solucin: a) No tenemos evidencias suficientes para afirmar que la estatura media de los alumnos de
preescolar de Andaluca es menor de 95 centmetros, al nivel de significacin a = 0,01. Los datos de
la muestra no permiten afirmar, a ese nivel, que la estatura media de estos alumnos es menor de 95
cm.
b) No tenemos evidencias suficientes para afirmar que la estatura media de los alumnos de
preescolar de Andaluca es mayor de 100 centmetros, al nivel de significacin a = 0,05. Los datos
de la muestra no permiten afirmar, a ese nivel, que la estatura media de estos alumnos es mayor
de 100 cm

INFERENCIA ESTADSTICA 18

También podría gustarte