Está en la página 1de 18

Resumen de Inferencia estadística

Inferencia estadística
Estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una
muestra, y el grado de fiabilidad o significación de los resultados obtenidos.

Muestreo
Muestreo probabilístico
Consiste en elegir una muestra de una población al azar. Podemos distinguir varios tipos:

Muestreo aleatorio simple:


Para obtener una muestra, se numeran los elementos de la población y se seleccionan al azar los
n elementos que contiene la muestra.

Muestreo aleatorio sistemático:


Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás hasta
completar la muestra.

Muestreo aleatorio estratificado:


Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de individuos
de cada estrato proporcional al número de componentes de cada estrato.

EJEMPLO

1.- En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de
actividades de ocio que gustan más a sus habitantes. Para ello van a ser
encuestados 100 individuos elegidos al azar.
a) Explicar qué procedimiento de selección sería más adecuado utilizar:
muestreo con o sin reposición. ¿Por qué?
b) Como los gustos cambian con la edad y se sabe que en el barrio viven 2.500
niños, 7.000 adultos y 500 ancianos, posteriormente se decide elegir la muestra
anterior utilizando un muestreo estratificado. Determinar el tamaño muestral
correspondiente a cada estrato.

Resolución:
a) Todas las fórmulas que hemos estudiado de teoría del muestreo y de
inferencia estadística presuponen que las poblaciones son infinitas o que, si no
lo son, el muestreo aleatorio se realiza con reposición.

b) Para efectuar un muestreo aleatorio estratificado, será necesario que la


muestra refleje fielmente los estratos existentes en la población; deben
considerarse los estratos formados por: niños, adultos y ancianos. El tamaño
muestral de cada estrato deberá ser proporcional a la presencia del mismo en
la población original:

Población total: 2500 + 7000 + 500 = 10 000.


Con los datos del problema en cada estrato tenemos:
n1 100
= ⇒ n1 = 25 niños.
2500 10000
n2 100
= ⇒ n2 = 70 adultos.
7000 10000
n3 100
= ⇒ n3 = 5 ancianos.
500 10000

INFERENCIA ESTADÍSTICA 1
2.- En cierta cadena de centros comerciales trabajan 150 personas en el
departamento de personal, 450 en el departamento de ventas, 200 en el
departamento de contabilidad y 100 en el departamento de atención al cliente.
Con objeto de realizar una encuesta laboral, se quiere seleccionar una muestra
de 180 trabajadores.
a) ¿Qué tipo de muestreo deberíamos utilizar para la selección de la muestra si
queremos que incluya a trabajadores de los cuatro departamentos mencionados?
b) ¿Qué número de trabajadores tendríamos que seleccionar en cada
departamento atendiendo a un criterio de proporcionalidad?

a) Utilizaremos un muestreo aleatorio estratificado, ya que queremos que haya


representantes de cada uno de los departamentos.

b) Población total:
N = 150+450+200+100 = 900

Con los datos del problema en cada estrato tenemos:


n1 180
= ⇒ n1 = 30 trabajadores de personal.
150 900
n2 180
= ⇒ n2 = 90 trabajadores de ventas.
450 900
n3 180
= ⇒ n3 = 40 trabajadores de contabilidad.
200 900
n4 180
= ⇒ n4 = 20 trabajadores de atención al cliente.
100 900

Estimación de la media de una población


Teorema central del límite
Si una población tiene media µ y desviación típica σ , y tomamos muestras de tamaño n (n>30, ó
cualquier tamaño si la población es "normal"), las medias de estas muestras siguen aproximadamente la
 σ 
distribución N µ, 
 n

Consecuencias:
 Permite averiguar la probabilidad de que la media de una muestra concreta esté en un cierto
intervalo.
 Permite calcular la probabilidad de que la suma de los elementos de una muestra esté, a
priori, en un cierto intervalo.
n
 σ 
∑x
i =1
i → N µ,
 n


 Inferir la media de la población a partir de una muestra.

EJEMPLO

1.- La variable altura de las alumnas que estudian en una escuela de idiomas
sigue una distribución normal de media 1,62 m y la desviación típica 0,12 m.
¿Cuál es la probabilidad de que la media de una muestra aleatoria de 100
alumnas sea mayor que 1.60 m?

Resolución:

INFERENCIA ESTADÍSTICA 2
 σ 
La distribución de las medias muestrales sigue una ley N  x ,  ya que el
 n
tamaño de la muestra n > 30.
 0,12 
N 1,62;  = N(1,62; 0,012)
 100 
 1,60 - 1,62 
P(X ≥ 1,60) = P  Z ≥  = P(Z ≥ -1,66) = P(Z ≤ 1,66) = 0,9515
 0,012 

2.- Las bolsas de sal envasadas por una máquina tienen µ = 500 g y σ = 35 g. Las
bolsas se empaquetaron en cajas de 100 unidades.
a) Calcular la probabilidad de que la media de los pesos de las bolsas de un
paquete sea menor que 495 g.
b) Calcular la probabilidad de que una caja 100 de bolsas pese más de 51 kg.

Resolución:
 σ 
La distribución de las medias muestrales sigue una ley N  x ,  ya que el
 n
tamaño de la muestra n > 30.
 35 
N  500;  = N(500; 3,5)
 100 
 495 - 500 
P(X ≤ 495) = P  Z ≤  = P (Z ≤ -1,43) = P (Z ≥ 1,43) = 1-P (Z ≤ 1,43) = 0,0764
 3,5 

b) Para calcular la probabilidad de que una caja 100 de bolsas pese más de 51 kg.
Suponemos que una bolsa debe pesar, por término medio 510 gramos:
 510 - 500 
P(X ≥ 510) = P  Z ≥  = P(Z ≥ 2,86) = 1-P(Z ≤ 2,86) = 0,0021
 3,5 

3.- Sea la población de elementos: {22,24, 26}.


a) Escriba todas las muestras posibles de tamaño dos, escogidas mediante
muestreo aleatorio simple.
b) Calcule la varianza de la población.
c) Calcule la varianza de las medias muestrales.

a) Las muestras posibles de tamaño dos, escogidas mediante muestreo


aleatorio simple, es decir sin reemplazamiento son:
{(22, 24), (22, 26), (24, 26)}

b) Para calcular la varianza de la población, hallamos antes la media poblacional.


22 + 24 + 26
µ= = 24
3
Luego la varianza es:
(22 − 24) 2 + (24 − 24) 2 + (26 − 24) 2 8
σ =
2
=
3 3

c) La media aritmética de todas las medias muestrales, µ x , es


23 + 24 + 25
µx = = 24
3
La desviación típica de todas las medias muestrales, σ x , es
(23 − 24) 2 + (24 − 24) 2 + (25 − 24) 2 2
σ2 = =
x 3 3

INFERENCIA ESTADÍSTICA 3
Estimación de la proporción de una población

Se denomina distribución muestral de proporciones de tamaño n, L(P), al conjunto formado por


todas las proporciones de una cierta población P que pose determinada característica p. L(P) se
 pq 
distribuye según una ley normal N  p, .
 n 

EJEMPLOS

1.- a) Una máquina produce tornillos, de los cuales se sabe que un 5%


son defectuosos, que se empaquetan en cajas de 400 unidades. ¿Cómo
se distribuye la proporción de tornillos en las cajas?
b) Calcular la probabilidad de que la proporción de los tornillos
defectuosos de una caja determinada sea mayor que el 7%.

Resolución:
a) Como la proporción de tornillos defectuosos es p = 0,05 y el tamaño de la
muestra es n = 400, la distribución es de tipo normal siendo:
µp = p = 0,05
pq 0,05.(1 - 0,05)
σp = = = 0,0011
n 400
Es decir la distribución normal N(0,05; 0,011)

 0,07 - 0,05 
b) P(X ≥ 0,07) = P  Z ≥  = P(Z ≥ 1,82) = 1-P(Z ≤ 1,82) = 0,0344
 0,011 

3.- Una población está formada por 3 elementos, con valores 1, 2 y 3.


a) Escribe todas las muestras simples de tamaño 2 que pueden extraerse.
b) Calcula la media y desviación típica de la distribución muestral de
proporciones de cifras impares.

Resolución:
a) Las muestras simples de tamaño 2 son {(1,2), (1,3), (2,3)}

b) La distribución muestral de proporciones de cifras impares es {1/2, 1, 1/2}.


La media y la desviación típica son:
0,5 + 1 + 0,5 2
• µp = p = =
3 3

(0,5 - 2/3) 2 + (1 - 2/3) 2 + (0,5 - 2/3) 2 1


• σp = =
3 6

Intervalos característicos
 El nivel de confianza (p) se designa mediante 1 - α.
 El nivel de significación se designa mediante α.
 El valor crítico (k) como z α/2 .
P(Z>z α/2) = α/2 P[-z α/2 < z < z α/2] = 1- α
En una distribución N(µ, σ ) el intervalo característico correspondiente a una probabilidad p = 1 - α
es: (µ - z α/2 · σ , µ + z α/2 · σ )

INFERENCIA ESTADÍSTICA 4
1-α α/2 z α/2 Intervalos característicos
0.90 0.05 1.645 (µ - 1.645 · σ , µ + 1.645 · σ)
0.95 0.025 1.96 (µ - 1.96 · σ , µ + 1.96 · σ )
0.99 0.005 2.575 (µ - 2.575 · σ , µ + 2.575 · σ )

Estimación de la media
 Intervalo de confianza para la media
El intervalo de confianza, para la media de una población, con un nivel de confianza de 1- α ,
siendo x la media de una muestra de tamaño n y σ la desviación típica de la población, es:
 σ σ 
 µ - Z α/2 , µ + Z α/2 
 n n
 El error máximo de estimación es:
σ
E = Z α/2
n
 Tamaño de la muestra:
2
Z σ
n =  α/2 
 E 

EJEMPLO

1.- Se ha tomado una muestra de los precios de un mismo producto alimenticio


en 16 comercios, elegidos al azar en un barrio de una ciudad, y se han
encontrado los siguientes precios:
95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110.
Suponiendo que los precios de este producto se distribuyen según una ley
normal de varianza 25 y media desconocida:
a) ¿Cuál es la distribución de la media muestral?
b) Determine el intervalo de confianza, al 95%, para la media poblacional.

Resolución:
a)La media muestral es:
95 + 108 + 97 + 112 + 99 + 106 + 105 + 100 + 99 + 98 + 104 + 110 + 107 + 111 + 103 + 110
x= = 104
16

b) Para un nivel de confianza del 95% tenemos que 1-α = 0,95, α/2 = 0,025,
luego Zα/2 = 1,96 pues P(X<1,96) = 0,975.
El intervalo de confianza es:
 σ σ   5 5 
 x - Zα /2 , x + Zα /2  = 104 - 1,96 ,104 + 1,96  = (101.55; 106.45)
 
 n n  16 16 

2.- La media de las estaturas de una muestra aleatoria de 400 personas de una
ciudad es 1,75 m. Se sabe que la estatura de las personas de esa ciudad es una
2
variable aleatoria que sigue una distribución normal con varianza σ2 = 0,16 m .
a) Construye un intervalo, de un 95% de confianza, para la media de las estaturas
de la población.
b) ¿Cuál sería el mínimo tamaño muestral necesario para que pueda decirse que
la verdadera media de las estaturas está a menos de 2 cm de la media muestral,
con un nivel de confianza del 90%?

INFERENCIA ESTADÍSTICA 5
Resolución:
a) Para un nivel de confianza del 95% tenemos que 1-α = 0,95, α/2 = 0,025,
luego Zα/2 = 1,96 pues P(X<1,96) = 0,975.
El intervalo de confianza es:
 σ σ   0,4 0,4 
 x - Zα /2 , x + Zα /2  = 1,75 - 1,96 ; 1,75 + 1,96  = (1.7108,1.7892)
 
 n n  400 400 

b) Para un nivel de confianza del 90% tenemos que 1-α = 0,90, α/2 = 0,05,
luego Zα/2 = 1,65 pues P(X<1,65) = 0,9500.
Como el margen de error es:
σ 0,4 0,4
E = Z α/2 ⇒ 0,02 = 1,65 ⇒ n = 1,65 = 32,9 ⇒ n = 1082,41
n n 0,02
La muestra debe tener al menos 1083 personas.

Estimación de una proporción


Si en una población, una determinada característica se presenta en una proporción p, la
proporción P, de individuos con dicha característica en las muestras de tamaño n, se distribuirán según:
 PQ 
N P,
 n 

 Intervalo de confianza para una proporción:
 
 P - Z α/2 PQ , P + Z α/2 PQ 
 n n 

 El error máximo de estimación es:

pq
E = Z α/2
n
 Tamaño de la muestra:
2
Z 
n = pq α/2 
 E 

EJEMPLO

1.- En una muestra de 300 personas tomadas al azar en una ciudad se


encontró que 104 de ellas leían el periódico. Halla, con un nivel de
confianza del 90%, la proporción de habitantes que leen el periódico y el
error máximo admisible para la proporción de habitantes que leen el
periódico

Resolución:
Una confianza del 90% significa que 1-α = 0,10, luego α/2 = 0,050, luego
tenemos Zα/2 = 1,645 pues P(X < 1,645) = 0,95.
104
La proporción muestral es p = = 0,347.
300

a) Como la muestra n = 104 > 30 podemos sustituir la proporción poblacional


por la muestral y el intervalo de confianza es:
 
 0,347 - 1,645 0,347.0653 ; 0,347 + 1,645 0,347.0653  = (0,302; 0,392)
 300 300 
 

INFERENCIA ESTADÍSTICA 6
b) El error máximo admisible es:
pq 0,347.0,65 3
E = Z α/2 = 1645
, = 0,045
n 300

2.- Se desea estimar la proporción, p, de individuos daltónicos de una


población a través del porcentaje observado en una muestra aleatoria de
individuos, de tamaño n.
a) Si el porcentaje de individuos daltónicos en la muestra es igual al 30%,
calcula el valor de n para que, con un nivel de confianza de 0,95, el error
cometido en la estimación sea inferior al 3,1%.
b) Si el tamaño de la muestra es de 64 individuos, y el porcentaje de
individuos daltónicos en la muestra es del 35%, determina, usando un
nivel de significación del 1%, el correspondiente intervalo de confianza
para la proporción de daltónicos de la población.

Resolución:
a) Para un nivel de confianza del 95% tenemos que 1-α = 0,95, α/2 = 0,025,
luego Zα/2 = 1,96 pues P(X<1,96) = 0,975.
Sustituyendo en la expresión del error máximo admisible:
2
pq 0,3.0,7  1,96 
E = Z α/2 ⇒ 1,96 = 0,031 ⇒ n = 0,3.0,7.  = 839, 48
n n  0,031 
Habrá que tomar al menos 840 individuos.

b) Para un nivel de significación del 1% tenemos un nivel de confianza del


99%, es decir, 1-α = 0,99, α/2 = 0,005, luego Zα/2 = 2,575 pues P(X<2,575) =
0,995.
 
 0,35 - 2,575 0,35.065 ; 0,35 + 2,575 0,35.065  = (0,196; 0,504)
 64 64 
 

Contrastes de hipótesis
Hipótesis estadísticas
Un test estadístico es un procedimiento para, a partir de una muestra aleatoria y significativa,
extraer conclusiones que permitan aceptar o rechazar una hipótesis previamente emitida sobre el valor
de un parámetro desconocido de una población.
La hipótesis emitida se designa por H0 y se llama hipótesis nula.
La hipótesis contraria se designa por H1 y se llama hipótesis alternativa.

Contrastes de hipótesis
1. Enunciar la hipótesis nula H0 y la alternativa H1.

Bilateral H0=k H1 ≠ k

H 0≥ k H1 < k
Unilateral
H0 ≤k H 1> k

2. A partir de un nivel de confianza 1 - α o el de significación α. Determinar:


El valor zα/2 (bilaterales), o bien zα (unilaterales)
La zona de aceptación del parámetro muestral (x o P).
3. Calcular: x o P, a partir de la muestra.

INFERENCIA ESTADÍSTICA 7
4. Si el valor del parámetro muestral está dentro de la zona de la aceptación, se acepta la
hipótesis con un nivel de significación α. Si no, se rechaza.

Contraste Bilateral
Se presenta cuando la hipótesis nula es del tipo H0: µ = k (o bien H0: p = k) y la hipótesis
alternativa, por tanto, es del tipo H1: µ≠ k (o bien H1: p≠ k).

El nivel de significación α se concentra en dos partes (o colas) simétricas respecto de la


media.
La región de aceptación en este caso no es más que el correspondiente intervalo de probabilidad
para x o P, es decir:
 σ σ 
 µ - Z α/2 , µ + Z α/2 
 n n
o bien:
 
 P - Z α/2 PQ , P + Z α/2 PQ 
 n n 

EJEMPLO

1.- Se sabe que la desviación típica de las notas de cierto examen de


Matemáticas es 2,4. Para una muestra de 36 estudiantes se obtuvo una
nota media de 5,6. ¿Sirven estos datos para confirmar la hipótesis de que
la nota media del examen fue de 6, con un nivel de confianza del 95%?

Resolución:
1. Enunciamos las hipótesis nula y alternativa:
H0 : µ = 6 La nota media no ha variado.
H1 : µ ≠ 6 La nota media ha variado.

2. Zona de aceptación
Para α = 0.05, le corresponde un valor crítico: zα/2 = 1.96.
Determinamos el intervalo de confianza para la media:
(6-1,96 · 0,4 ; 6+1,96 · 0,4) = (5,22 ; 6,78)

3. Verificación.
Valor obtenido de la media de la muestra: 5,6.

4. Decisión
Aceptamos la hipótesis nula H0, con un nivel de significación del 5%.

2.- Un fabricante de lámparas eléctricas está ensayando un nuevo método de


producción que se considerará aceptable si las lámparas obtenidas por este
método dan lugar a una población normal de duración media 2400 horas, con una
desviación típica igual a 300. Se toma una muestra de 100 lámparas producidas

INFERENCIA ESTADÍSTICA 8
por este método y esta muestra tiene una duración media de 2320 horas. ¿Se
puede aceptar la hipótesis de validez del nuevo proceso de fabricación con un
riesgo igual o menor al 5%?

Resolución:
1 Enunciamos las hipótesis nula y alternativa:
H0 : µ = 2400
H1 : µ ≠2400

2 Zona de aceptación
α = 0.05 zα = 1.96.
Determinamos el intervalo de confianza para la media:
 300 300 
 2400 − 1,96 , 2400 + 1,96  = (2341,1; 2458,8)
 100 100 

3 Verificación.
Valor obtenido de la media de la muestra: 2320.

4 Decisión
Rechazamos la hipótesis nula H0, con un nivel de significación del 5%.

3.- Se cree que el nivel medio de protombina en una población normal es de 20


mg/100 ml de plasma con una desviación típica de 4 miligramos/100 ml. Para
comprobarlo, se toma una muestra de 40 individuos en los que la media es de
18.5 mg/100 ml. ¿Se puede aceptar la hipótesis, con un nivel de significación del
5%?

Resolución:
1 Enunciamos las hipótesis nula y alternativa:
H0 : µ =20 mg/100 ml
H1 : µ ≠ 20 mg/100 ml

2 Zona de aceptación
Para α = 0.05, le corresponde un valor crítico: zα/2 = 1.96.
Determinamos el intervalo de confianza para la media:
 4 4 
 20 − 1,96 , 20 + 1,96  = (18,77; 21,23)
 40 40 

3 Verificación.
Valor obtenido de la media de la muestra: 18.5.

4 Decisión
Rechazamos la hipótesis nula H0, con un nivel de significación del 5%.

Contraste unilateral

Caso 1
La hipótesis nula es del tipo H0: µ ≥ k (o bien H0: p ≥ k).
La hipótesis alternativa, por tanto, es del tipo H1: µ < k (o bien H1: p < k).

Valores críticos
1-α α zα
0.90 0.10 1.28

INFERENCIA ESTADÍSTICA 9
0.95 0.05 1.645
0.99 0.01 2.33

El nivel de significación α se concentra en una parte o cola.


La región de aceptación en este caso será:
 σ 
 µ - Zα/2 , ∞ 
 n 
o bien:
 
 P - Zα/2 PQ , ∞ 
 n 
 

EJEMPLO

1.- Un sociólogo ha pronosticado, que en una determinada ciudad, el


nivel de abstención en las próximas elecciones será del 40% como
mínimo. Se elige al azar una muestra aleatoria de 200 individuos, con
derecho a voto, 75 de los cuales estarían dispuestos a votar. Determinar
con un nivel de significación del 1%, si se puede admitir el pronóstico.

Resolución:
1. Enunciamos las hipótesis nula y alternativa:
H0 : p ≥ 0.40 La abstención será como mínimo del 40%.
H1 : p < 0.40 La abstención será como máximo del 40%;

2. Zona de aceptación
Para α = 0.01, le corresponde un valor crítico: zα = 2.33.
Determinamos el intervalo de confianza para la media:
 
 0,4 - 2,33 0,4.06 , ∞  = (0,3192; ∞)
 200 
 
3. Verificación.
125
P= = 0,625
200

4. Decisión
Aceptamos la hipótesis nula H0. Podemos afirmar, con un nivel de significación del
1%, que la La abstención será como mínimo del 40%.

2.- La duración de la bombillas de 100 W que fabrica una empresa sigue una
distribución normal con una desviación típica de 120 horas de duración. Su vida
media está garantizada durante un mínimo de 800 horas. Se escoge al azar una
muestra de 50 bombillas de un lote y, después de comprobarlas, se obtiene una

INFERENCIA ESTADÍSTICA 10
vida media de 750 horas. Con un nivel de significación de 0,01, ¿habría que
rechazar el lote por no cumplir la garantía?

Resolución:
1 Enunciamos las hipótesis nula y alternativa:
H0 : µ ≥ 800
H1 : µ <800

2 Zona de aceptación
α = 0.01; zα = 2.33
Determinamos el intervalo de confianza:
 120 
 800 − 2,33 , ∞  = (760,46, ∞)
 50 

3 Verificación.
x = 750

4 Decisión
Rechazamos la hipótesis nula H0. Con un nivel de significación del 1%.

3.- El control de calidad una fábrica de pilas y baterías sospecha que hubo
defectos en la producción de un modelo de batería para teléfonos móviles,
bajando su tiempo de duración. Hasta ahora el tiempo de duración en
conversación seguía una distribución normal con media 300 minutos y
desviación típica 30 minutos. Sin embargo, en la inspección del último lote
producido, antes de enviarlo al mercado, se obtuvo que de una muestra de 60
baterías el tiempo medio de duración en conversación fue de 290 minutos.
Suponiendo que ese tiempo sigue siendo Normal con la misma desviación típica:
¿Se puede concluir que las sospechas del control de calidad son ciertas a un
nivel de significación del 2%?

Resolución:
1 Enunciamos las hipótesis nula y alternativa:
H0 : µ ≥ 300
H1 : µ < 300

2 Zona de aceptación
α = 0.02; 1- α = 0. 98; P(1.96)= 0. 98; zα = 1.96 .
Determinamos el intervalo de confianza:
 30 
 300 − 2,33 , ∞  = (290,98, ∞)
 60 

3 Verificación.
µ = 290

4 Decisión
Rechazamos la hipótesis nula H0. Con un nivel de significación del 2%.

Caso 2
La hipótesis nula es del tipo H0: µ ≤ k (o bien H0: p ≤ k).
La hipótesis alternativa, por tanto, es del tipo H1: µ > k (o bien H1: p > k).

INFERENCIA ESTADÍSTICA 11
El nivel de significación α se concentra en la otra parte o cola.

La región de aceptación en este caso será:


 σ 
 − ∞, µ + Z α/2 
 n
o bien:
 
 − ∞, P + Z α/2 PQ 
 n 

EJEMPLO

1.- Un informe indica que el precio medio del billete de avión entre
Canarias y Madrid es, como máximo, de 120 € con una desviación típica
de 40 €. Se toma una muestra de 100 viajeros y se obtiene que la media
de los precios de sus billetes es de 128 €.
¿Se puede aceptar, con un nivel de significación igual a 0,1, la afirmación
de partida?

Resolución:
1. Enunciamos las hipótesis nula y alternativa:
H0 : µ ≤ 120
H1 : µ > 120

2. Zona de aceptación
Para α = 0.1, le corresponde un valor crítico: zα = 1.28 .
Determinamos el intervalo de confianza:
 40 
 − ∞, 120 + 1,28  = (-∞; 125,12)
 100 

3. Verificación.
Valor obtenido de la media de la muestra: 128 € .

4. Decisión
No aceptamos la hipótesis nula H0. Con un nivel de significación del 10%.

2.- Una marca de nueces afirma que, como máximo, el 6% de las nueces están
vacías. Se eligieron 300 nueces al azar y se detectaron 21 vacías.
a) Con un nivel de significación del 1%, ¿se puede aceptar la afirmación de la
marca?
b) Si se mantiene el porcentaje muestral de nueces que están vacías y 1-α = 0.95,
¿qué tamaño muestral se necesitaría para estimar la proporción de nueces con
un error menor del 1% por ciento?

Resolución:
a) 1 Enunciamos las hipótesis nula y alternativa:
H0 : p ≤ 0.06

INFERENCIA ESTADÍSTICA 12
H1 : p >0.06

2 Zona de aceptación
α = 0.01 zα = 2.33.
Determinamos el intervalo de confianza:
 
 − ∞, 0,06 + 2,33 0,06.0,94  = (-∞; 0,092)
 300 

3 Verificación.
21
P= = 0,07
300

4 Decisión
Aceptamos la hipótesis nula H0. Con un nivel de significación del 1%.

b) Tenemos que:
1 - α = 0, 95 ⇒ Zα/2 = 1, 96
0,07.0,93
0,01 = 1,96 ⇒ n = 50 ⇒ n = 2500
n
Luego:
n ≥ 2501

Errores de tipo I y tipo II

 Error de tipo I. Se comete cuando la hipótesis nula es verdadera y, como consecuencia del
contraste, se rechaza.
 Error de tipo II. Se comete cuando la hipótesis nula es falsa y, como consecuencia del
contraste se acepta.
H0 Verdadera Falsa

Decisón correcta Decisión incorrecta:


Aceptar
Probabilidad = 1 - α ERROR DE TIPO II

ERROR DE TIPO I
Rechazar Decisión correcta
Probabilidad = α

La probabilidad de cometer Error de tipo I es el nivel de significación α.


La probabilidad de cometer Error de tipo II depende del verdadero valor del parámetro. Se hace
tanto menor cuanto mayor sea n.

INFERENCIA ESTADÍSTICA 13
Relación de Ejercicios de Contrastes de Hipótesis.
Ponencia Andaluza de Matemáticas Aplicadas a las Ciencias Sociales II.

1. La altura en cm. de las cañas producidas por una variedad de carrizo en cada cosecha es una variable
aleatoria que sigue una ley normal con desviación típica a = 16 cm. Para contrastar si la altura media
de las cañas de la última cosecha es de 170 cm, se ha tomado una muestra aleatoria de 64 de estas
canas y se han medido sus longitudes, resultando como media muestral x = 166 cm.
¿Son suficientes estos datos para rechazar que la altura media de las cañas de la última cosecha es de
170 cm, a un nivel de significación α = 0,05?
Solución: Estos datos son suficientes para rechazar, a este nivel, que la altura media de las cañas de
esta cosecha sea de 170 cm.

2. Un comerciante ha observado durante un largo periodo de tiempo que sus beneficios semanales se
distribuyen según una ley normal con una media de 5000 euros y una desviación típica de 520 euros. A
finales del año pasado se abrió un supermercado frente a su comercio y él cree que su beneficio
semanal medio ha disminuido desde entonces. Para contrastar esta suposición, ha tomado una muestra
aleatoria de 16 semanas del año actual y ha encontrado que el beneficio semanal medio de esa muestra
es de 4700 euros. ¿Puede afirmarse, a un nivel de significación α = 0, 01, que estos datos avalan la
creencia del comerciante?
Solución: No se puede afirmar, al nivel 0,01, que los datos de la muestra apoyan la creencia de que el
nuevo supermercado ha disminuido el beneficio semanal medio del comerciante.

3. Solo el 75 % de los alumnos de un centro de enseñanza realizan correctamente un test psicotécnico


que lleva utilizándose mucho tiempo. Para tratar de mejorar este resultado, se modificó la redacción
del test, y se propuso a un grupo de 120 alumnos de ese centro, elegidos al azar. De los 120 alumnos a
los que se les paso el nuevo test, lo realizaron correctamente 107. ¿Podemos afirmar que la nueva
redacción del test ha aumentado la proporción de respuestas correctas, a un nivel de significación α =
0,025?
Solución: Podemos afirmar que la nueva redacción del test ha aumentado la proporción de respuestas
correctas, a un nivel de significación α = 0,025.

4. El peso en vacío de los envases fabricados por una empresa, según su método usual, es una variable
aleatoria que sigue una ley normal con media 20 gramos y una desviación típica de 1 gramo.
Se desea contrastar si un nuevo proceso de fabricación no aumenta dicho peso medio. Para ello, se
eligen al azar 25 envases fabricados por la nueva técnica y se encuentra que la media de su peso en
vacío es de 20,5 gramos.
¿Se puede afirmar, a un nivel de significación a = 0,02, que el nuevo proceso ha aumentado el peso
medio de los envases?
Solución: A la vista de los datos obtenidos en la muestra, se puede afirmar, al nivel α = 0,02, que el
nuevo proceso ha aumentado el peso medio de los envases.

5. En unas elecciones municipales de una ciudad, el 42 % de los votantes dieron su voto al partido A. En
una encuesta realizada un año después a 500 personas con derecho a voto, solo 184 votarían al partido
A. Con estos datos, ¿puede afirmarse que ha disminuido la proporción de votantes a ese partido?
Responder a la pregunta anterior con niveles de significación α = 0,01, α = 0,025 y α = 0,001.
Solución: Los datos permiten afirmar que ha disminuido la proporción de votantes al partido A a los
niveles 0,025 y 0,01, pero no ha disminuido la proporción al nivel 0,001.

6. En una ciudad, donde la proporción de fumadores con edad comprendida entre 18 y 20 años es del 30
%, el ayuntamiento ha realizado una campaña contra el consumo de tabaco. Dos meses después de
terminar dicha campaña, se ha realizado una encuesta a 400 personas de estas edades, elegidas al azar,
y se ha encontrado entre ellos a 92 fumadores. ¿Podemos afirmar, a un nivel de significación α =
0,05, que esta campaña ha modificado la proporción de fumadores entre 18 y 25 años?
Solución: Estos datos son suficientes para afirmar, al nivel 0,05, que se ha modificado la proporción
de fumadores entre los 18 y 25 anos.

7. Un fabricante de automóviles produce dos tipos de un determinado modelo de turismo: el tipo A, con
motor de gasolina, y el tipo B, con motor de gasoil. De una muestra aleatoria de 200 turismos de este

INFERENCIA ESTADÍSTICA 14
modelo, 112 son del tipo B. ¿Proporcionan estos datos suficiente evidencia, a un nivel de significación
α = 0,01, de que los clientes prefieren el modelo del tipo B al del tipo A?
Solución: No tenemos evidencias suficientes para afirmar que los clientes prefieren el modelo del tipo
B de gasoil, al del tipo A de gasolina, al nivel de significación α = 0,01.

8. Supongamos que 100 neumáticos de cierta marca duraron en promedio 21431 kilómetros. Si se supone
que la población es normal con una desviación típica poblacional de 1295 km, utilizando α = 0,05,
¿podemos considerar que la duración media de los neumáticos es inferior a 22000 km?
Solución: Podemos afirmar que la duración media de los neumáticos de dicha marca es menor de
22000 Km., con una probabilidad de error tipo I, α , del 5 %.

9. Un constructor afirma que por lo menos el 75% de las casas que construye tienen calefacción. ¿Se
estaría de acuerdo con tal afirmación si una inspecciona aleatoria muestra que 72 de 135 casas cuentan
con calefacción? (Usar α = 0,1 )
Solución: Los datos de la muestra son suficientes para rechazar, a este nivel α = 0,1, la afirmación
del constructor de que la proporción de casas con calefacción que éste construye no es inferior al
75%.

10. Una compañía textil afirma que a lo sumo el 20 % del público compra ropa de lana. Verifica esta
afirmación para α = 0,01 , si una encuesta aleatoria indica que 46 de 200 clientes compran ropa de
lana.
Solución: Los datos de la muestra no son suficientes para rechazar, a este nivel, que la proporción del
público que compra ropa de lana no supera el 20 %.

11. Se sabe que la longitud en cm de una determinada especie de coleópteros sigue una distribución
normal de varianza 0,25 cm2. Capturados 6 ejemplares de dicha especie, sus longitudes (en cm)
fueron: 2,75 1,72 2,91 2,6 2,64 3,34 ¿Se puede aceptar la hipótesis de que la población tiene una
longitud media de 2,656 cm? (Usar α = 0,05 )
Solución: No tenemos evidencias suficientes para rechazar que la longitud media de esa especie de
coleópteros es de 2.656 cm, con una probabilidad de error tipo I, α , del 5 %.

12. La edad de la población que vive en residencias de mayores en Cádiz sigue una distribución normal
de desviación típica 7,3 años. Se toma una muestra aleatoria simple de tamaño 50, y se obtiene una
media muestral de 69 anos. ¿Se puede asegurar que la edad media de la población que vive en
residencias de mayores en Cádiz es mayor de 70 años con un nivel de significación del 5 %?
Solución: Puede decirse que los datos de la muestra no permiten afirmar que la media de edad de
esas personas sea mayor que 70 años, al nivel de significación α = 0,05.

13. Para conocer la producción media de sus olivos, un olivarero escoge al azar 10 de ellos, pesa su
producción de aceitunas, y obtiene los siguientes valores, expresados en Kg.: 175, 180, 210, 215,
186, 213, 190, 213, 184, 195. Sabemos que la producción sigue una distribución normal con
desviación típica igual a 15.3 Kg. Con la información obtenida, ¿se puede asegurar que la producción
media de un olivo de ese agricultor es menor de 200 Kg? (Usar α = 0,05 )
Solución: Puede decirse que los datos de la muestra confirman que la producción media de un olivo
de ese agricultor es menor de 200 Kg., al nivel de significación α = 0,05.

14. El 40 % de los escolares de cierto país suelen perder al menos un día de clase a causa de gripes y
catarros. Sin embargo, un estudio sobre 1000 escolares revela que en el último curso hubo 450 en
tales circunstancias. Las autoridades defienden que el porcentaje del 40% para toda la población de
escolares se ha mantenido. Contrastar con un nivel de significación del 5 % la hipótesis defendida
por las autoridades sanitarias, frente a que el porcentaje ha aumentado, como parecen indicar los
datos, explicando claramente a que conclusión se llega.
Solución: Estos datos son suficientes para afirmar, al nivel α = 0,05, que el porcentaje de escolares
que pierden al menos un día de clase por causa de gripes y catarros ha aumentado, por lo que ese
porcentaje es mayor del 40 %. Entonces, la hipótesis mantenida por las autoridades no es correcta.

15. Una de las entradas a cierta ciudad andaluza sufría constantemente retenciones de trófico, de forma
que el tiempo de espera en la cola formada por el semáforo allí instalado seguía una distribución
Normal de media 10 minutos y desviación tópica 4 minutos. Con el fin de descongestionar ese punto

INFERENCIA ESTADÍSTICA 15
y bajar la media de tiempo de espera, se habilito una vía de acceso auxiliar. Transcurrida una semana
se hizo un estudio sobre 36 vehículos y se obtuvo que el tiempo medio de espera en el citado
semáforo fue de 8.5 minutos. Las autoridades municipales mostraron su satisfacción y dijeron que la
medida había funcionado, pero la opinión pública, sin embargo, defiende que la situación sigue igual.
Suponiendo que la desviación tópica se ha mantenido:
a) Plantee un test para contrastar la hipótesis defendida por la opinión pública frente a la de los
responsables municipales. Si se concluye que la media de tiempo de espera bajó y realmente no
lo hizo, ¿como se llama el error cometido?
b) ¿A que conclusión se llega con un nivel de significación del 5 %?
c) ¿A que conclusión se llega con un nivel de significación del 1 %?
Solución: a) El error se denomina Error tipo I, y la probabilidad de cometer un error de tipo I se
denomina α . Estos datos son suficientes para afirmar, al nivel α = 0,05, que el tiempo medio de
espera en dicho semáforo ha bajado, por lo que ese tiempo de espera es ahora menor de 10
minutos. Entonces, la hipótesis mantenida por las autoridades municipales es correcta, y la medida
de habilitar una vía de acceso auxiliar ha descongestionado el trafico en la entrada de dicha
ciudad. Sin embargo, para un nivel α = 0,01 no se puede rechazar la hipótesis nula, y por tanto el
tiempo medio de espera en el semáforo sigue siendo de 10 minutos.

16. En un hospital se observó que los pacientes abusaban del servicio de urgencias, de forma que un 30
% de las consultas podían perfectamente haber esperado a concertar una cita con el medico de
cabecera, porque no eran realmente urgencias. Puesto que esta situación ralentizaba el servicio, se
realizo una campaña intensiva de concienciación. Transcurridos unos meses se ha recogido
información de 120 consultas al servicio, de las cuales sólo 30 no eran realmente urgencias:
a) Hay personal del hospital que defiende que la campaña no ha mejorado la situación. Plantee un
test para contrastar esta hipótesis frente a que sí la mejoro. Si se concluye que la situación no ha
mejorado y realmente sí lo hizo, ¿cómo se llama el error cometido?
b) ¿A qué conclusión se llega en el test planteado en el apartado anterior con un nivel de
significación del 1%?
Solución: a) El error se denomina Error tipo II. b) La campaña de concienciación no ha reducido
el porcentaje de pacientes (30%) que abusan del servicio de urgencias, al nivel de significación
α = 0, 01.

17. El alcalde de una ciudad prometió, en su programa electoral, oponerse a la construcción de una
central de tratamiento de ciertos residuos, puesto que en aquel momento solo un 10 % de los
ciudadanos estaban a favor de la central de tratamiento de residuos. En los últimos días se ha
encuestado a 100 personas de las cuales 14 están a favor de la central. El alcalde afirma sin embargo
que el porcentaje de ciudadanos a favor sigue siendo del 10 % o incluso ha disminuido. ¿Tiene razón
el alcalde con un nivel de significación del 2 %?
Solución: No tenemos evidencias suficientes para afirmar que el porcentaje de ciudadanos que
estarían a favor de la construcción de la central de tratamiento de residuos es mayor del 10 %, al
nivel de significación α = 0,02. Por tanto, los datos de la muestra avalan la opinión del alcalde de
que el porcentaje de ciudadanos a favor sigue siendo del 10 % o incluso ha disminuido.

18. Se desea estudiar el gasto mensual de los teléfonos móviles, en euros, de los estudiantes
universitarios andaluces. Para ello, se ha elegido una muestra aleatoria de 10 de estos estudiantes,
resultando los valores siguientes para el gasto mensual en móvil:
30 60 25 20 25 30 35 45 50 40

Se supone que la variable aleatoria objeto de estudio sigue una distribución normal de media
desconocida y de desviación tópica igual a 12 euros.
a) ¿Se puede asegurar que los estudiantes universitarios andaluces gastan menos de 50 euros
mensuales en teléfono Mobil? (Usar α = 0,01)
b) ¿Cuál es la desviación tópica de la media muestral?
Solución: a) Estos datos son suficientes para afirmar, al nivel α = 0,01, que los estudiantes
universitarios andaluces gastan menos de 50 euros al mes en teléfono móvil. b) La desviación tópica
de la media muestral es σ = 3,795.

INFERENCIA ESTADÍSTICA 16
19. Una máquina de envasado automático llena en cada saco una cierta cantidad de determinado
producto. Se seleccionan 20 sacos, se pesa su contenido y se obtienen los siguientes resultados (en
kilos):
49, 50,49, 50, 50, 50,49, 50, 50, 50, 49, 50, 50, 51, 52, 48, 50, 51, 51, 51
A partir de esta información y suponiendo que la variable, peso de cada saco, se distribuye
normalmente con desviación típica 1 Kg.:
a) ¿Se puede admitir que el peso medio de los sacos que llena la maquina es de aproximadamente
51 kg? (Usar a = 0,01)
b) ¿Se puede admitir que el peso medio de los sacos que llena la maquina es menor de 50 Kg? (Usar
α = 0,05)
Solución: a) Podemos afirmar que la maquina no envasa sacos de aproximadamente 51 kg, al nivel
de significación α = 0, 01. b) Podemos decir que los mismos datos apoyan la hipótesis de que el
peso medio de los sacos no es inferior a los 50 Kg, al nivel de significación α = 0,05.

20. El consumo de cierto producto sigue una distribución normal con varianza 300. A partir de una
muestra de tamaño 25 se ha obtenido una media muestral igual a 180.
a) Halle un intervalo de confianza al 95 % para la media del consumo.
b) ¿Se podría afirmar que el consumo medio de este producto no llega a 200? (Usar α = 0,05)
Solución a) Un intervalo de confianza al 95% para la media del consumo es (173,21; 186,79).
b) Los datos de esta muestra permiten afirmar que el consumo medio de este producto no llega a
200, al nivel de significación α = 0,05.

21. Los estudiantes universitarios de cierto país dedican al estudio un número de horas semanales que
sigue una distribución normal de media desconocida y de desviación típica 7 horas. Si en una
muestra de 200 estudiantes se obtuvo una media muestral de 30 horas de estudio semanal.
a) Halle un intervalo de confianza al 95 % para el número de horas de estudio semanales de los
estudiantes universitarios de dicho país.
b) ¿Se podría afirmar que los estudiantes universitarios de ese país estudian menos de 35 horas
semanales? (Usar α = 0,01)
Solución: a) Un intervalo de confianza al 95 % para la media de horas de estudio semanales de los
universitarios es (29,03; 30,97).
b) Podemos afirmar que la media del número de horas de estudio semanales de los universitarios es
menor de 35 horas, al nivel de significación α = 0,01.

22. La talla de los individuos de una población sigue una distribución normal de desviación típica 8 cm.
Se han determinado las tallas de 25 individuos, encontrándose una media de 168 cm. ¿Se podría
afirmar que la talla media de la población es menor de 170 cm? (Usar α = 0,03)
Solución: No tenemos evidencias suficientes para afirmar que la talla media de la población es
menor de 170 cm, al nivel de significación α = 0,03.

23. Los estudiantes de Bachillerato de una cierta comunidad autónoma duermen un número de horas
diarias que se distribuye según una ley normal de media desconocida y desviación tópica 3 horas. A
partir de una muestra aleatoria de tamaño 30 se ha obtenido una media igual a 7 horas. ¿Se podría
afirmar que el número medio de horas de sueño de los estudiantes de Bachillerato de dicha
comunidad autónoma es mayor de 6 horas? (Usar α = 0,04)
Solución: En consecuencia, a este nivel α = 0,04, los datos de la muestra permiten afirmar que el
numero medio de horas de sueno de los estudiantes de Bachillerato de dicha comunidad autónoma
es mayor de 6 horas.

24. Las autoridades educativas publican en un estudio que el 25 % de los estudiantes de Bachillerato de
una cierta comunidad autónoma tienen ordenador portátil. A partir de una muestra aleatoria de
tamaño 300 se ha obtenido que solo 70 de ellos tienen ordenador portátil. ¿Se podría asegurar que las
autoridades dicen la verdad? (Usar α = 0,06)
Solución: No tenemos evidencias suficientes para afirmar que el porcentaje de estudiantes de
Bachillerato que tienen ordenador portátil es distinto del 25%, al nivel de significación α = 0,06.
En consecuencia, a este nivel, los datos no permiten rechazar que el estudio se corresponda con la
realidad. Por tanto, podemos afirmar que las autoridades educativas dicen la verdad.

INFERENCIA ESTADÍSTICA 17
25. Un laboratorio farmacéutico fabrica un producto para la caída del cabello que envasa en botes, y en el
etiquetado indica que su contenido aproximado es de 100 c.c. Se eligen, al azar, 7 de estos botes y se
miden sus contenidos dando el siguiente resultado (en c.c.):
97 101 102 99 98 100 103
¿Podemos asegurar que la capacidad media de los botes que se fabrican es la indicada en el bote?
(Usar α = 0,01) (Se sabe que el contenido es una variable aleatoria normal de desviación tópica 2
c.c.)
Solución: Podemos asegurar que la capacidad media de los botes que se fabrican es la indicada en
la etiqueta (100 c.c.), al nivel de significación α = 0,01.

26. Se ha tomado una muestra de precios de un mismo producto en 16 comercios, elegidos al azar en una
ciudad, y se han encontrado los siguientes precios (en euros):
95,108, 97,112, 99,106,105,100, 99, 98,104,110,107,111,103,110.

Suponiendo que los precios de este producto se distribuyen según una ley normal de varianza 25 y
media desconocida:
a) ¿Cual es la distribución de la media muestral?
b) ¿Se puede afirmar que el precio medio de dicho producto es menor de 105 euros? (Usar α = 0,03)
Solución: a) La distribución de la media muestral sigue una ley Normal con media desconocida (la
misma que la media de la población) y desviación típica σ = 5/4 = 1,25.
b) No tenemos evidencias suficientes para afirmar que el precio medio de dicho producto en esa
ciudad es menor de 105 euros, al nivel de significación α = 0,03.

27. Los alumnos de preescolar de Andalucía tienen una estatura que es una variable aleatoria de media
desconocida y desviación tópica 16 cm. Si seleccionamos una muestra aleatoria de 100 de tales
alumnos y obtenemos una estatura media de 95 cm,
a) ¿se puede afirmar que la estatura media de los alumnos de preescolar de Andalucía es menor de
95 cm? (Usar α = 0,01)
b) ¿se puede afirmar que la estatura media de los alumnos de preescolar de Andalucía es mayor de
100 cm? (Usar α = 0,05)
Solución: a) No tenemos evidencias suficientes para afirmar que la estatura media de los alumnos de
preescolar de Andalucía es menor de 95 centímetros, al nivel de significación a = 0,01. Los datos de
la muestra no permiten afirmar, a ese nivel, que la estatura media de estos alumnos es menor de 95
cm.
b) No tenemos evidencias suficientes para afirmar que la estatura media de los alumnos de
preescolar de Andalucía es mayor de 100 centímetros, al nivel de significación a = 0,05. Los datos
de la muestra no permiten afirmar, a ese nivel, que la estatura media de estos alumnos es mayor
de 100 cm

INFERENCIA ESTADÍSTICA 18

También podría gustarte