Está en la página 1de 14

TEMA 5.

INFERENCIA ESTADÍSTICA

Objetivos
Distinguir claramente entre población y muestra.

Saber en que consiste la inferencia estadística.

Conocer el concepto de distribución muestral.

Saber calcular intervalos de conanza.

Interpretar que signica el nivel de conanza de un intervalo.

Entender los conceptos de hipótesis nula, hipótesis alternativa, estadístico de


contraste, región crítica de rechazo y región de aceptación.

Saber realizar un contraste de hipótesis.

Saber diferenciar entre contrastes unilaterales y bilaterales.

69
70

Conceptos fundamentales de estimación

• El objetivo de la inferencia estadística es extraer conclusiones referentes a una carac-


terística estudiada de la población a partir de un subconjunto representativo de ésta,
que es la muestra.

• A partir del conocimiento de las correspondientes cantidades muestrales llamadas


estadísticos muestrales se estiman cantidades desconocidas de la población lla-
madas parámetros poblacionales.

• Se denomina estimador de un parámetro poblacional desconocido a todo estadístico


que nos da un valor que está próximo al parámetro poblacional desconocido.

Tenemos tres maneras de llevar a cabo la inferencia:

Estimación puntual: se toma como valor del parámetro poblacional desconocido


el calculado por el estadístico.

Contraste de hipótesis: permite probar si determinadas armaciones respecto del


valor de los parámetros poblacionales desconocidos son ciertas o falsas con un
nivel de conanza dado, en función de los datos muestrales.

Estimación por intervalos: calcula un intervalo dentro del cual se encuentra el


parámetro poblacional desconocido con un nivel de conanza dado.
71

1. En una población nita de tamaño N, se dene

Parámetro media poblacional.


N
X
Xi
i=1
µ=
N
Parámetro varianza poblacional.
N
(Xi − µ)2
X

i=1
σ2 =
N
2. Para una muestra aleatoria simple de tamaño n, X1 , X2 , . . . Xn , se dene

Estadístico media muestral.


n
X
Xi
i=1 σ2
X̄ = ; E(X̄) = µ, V ar(X̄) =
n n
Estadístico varianza muestral.
n
(Xi − X̄)2
X

i=1
S2 =
n
Estadístico cuasivarianza muestral.
n
(Xi − X̄)2
X

i=1 n n−1 2
Ŝ 2 = ; Ŝ 2 = S 2; S2 = Ŝ
n−1 n−1 n

Los estimadores puntuales más utilizados son:

De la media poblacional, la media muestral.

De la varianza poblacional, la cuasivarianza muestral.


72

Sea X −→ N (µ, σ) y sea X1 , X2 , . . . Xn


una muestra aleatoria simple de tamaño n
2
de X, con media muestral X̄ y cuasivarianza muestral Ŝ .

Distribución de la media muestral cuando se conoce la varianza poblacional σ2.


!
σ X̄ − µ
X̄ → N µ, √ ; √ → N (0, 1)
n σ/ n

• EJEMPLO: Supongamos una población cuya característica en estudio se en-


µ = 12 y σ 2 = 16.
cuentra normalmente distribuida de media

1. Probabilidad de que un elemento de la población, elegido al azar, tenga la


característica superior a 14. (Sol. 0.3085)

2. Se considera una muestra aleatoria de tamaño n = 9. ¾Cuál es la probabili-


dad de que la media muestral tenga un valor superior a 14? (Sol. 0.0668)

3. Para la misma muestra anterior ¾Cuál será la varianza de la media muestral?


(Sol. 1.78)

Distribución de la media muestral cuando no se conoce la varianza poblacional


σ 2 y n ≤ 30.

X̄ − µ X̄ − µ
T = √ → tn−1 ; T = √ → tn−1
Ŝ/ n S/ n − 1

• EJEMPLO: Se sabe que en una determinada empresa, la cantidad mensual de


gasolina utilizada por cada camión sigue una distribución normal con media 160
litros. Si se toma una muestra de nueve camiones y se obtiene una cuasivarian-
2
za muestral de 81 (litros) . ¾Cuál es la probabilidad de que la gasolina media
muestral esté comprendida entre 150 y 170 litros? (Sol. 0.99)

Distribución de la media muestral cuando no se conoce la varianza poblacional


σ 2 y n > 30.

X̄ − µ X̄ − µ
T = √ → N (0, 1); T = √ → N (0, 1)
Ŝ/ n S/ n − 1

• EJEMPLO: Supongamos una población cuya característica en estudio se en-


cuentra normalmente distribuida con media µ = 13. Se considera una muestra
aleatoria de tamaño n = 100, con cuasivarianza muestral de 49. ¾Cuál es la pro-
babilidad de que la media muestral tenga un valor superior a 14.15? (Sol. 0.05)
73

Estimación por intervalos de conanza


Se trata de encontrar un intervalo [a, b] de manera que el parámetro poblacional des-
conocido se encuentre en dicho intervalo con un determinado nivel de conanza. Para
hallar dicho intervalo se utilizan los datos de una muestra, que evidentemente cambiará
de una a otra, por lo que el valor del intervalo también cambiará.
El término nivel de conanza, por ejemplo 95 %, se reere a que si tomamos 100
muestras aleatorias de tamaño n de la misma población y para cada una de ellas cons-
truimos dicho intervalo de conanza para un parámetro desconocido de la población
se espera que aproximadamente el 95 % de los intervalos contengan en su interior el
verdadero valor del parámetro y el 5 % no lo contendrán. Pero en la práctica, sólo se
toma una muestra aleatoria, y por tanto sólo tenemos un intervalo de conanza y no
conocemos si nuestro intervalo es uno del 95 % o uno del 5 %. Por eso al intervalo se le
llama intervalo de conanza al nivel de conanza del 95 %
Para hallar el intervalo de conanza de un parámetro poblacional, θ, se partirá de
un estimador de dicho parámetro, con la condición de que la probabilidad de que el
parámetro poblacional desconocido se encuentre en dicho intervalo sea 1 − α, es decir

P (θ̂1 ≤ θ ≤ θ̂2 ) = 1 − α

siendo θ̂1 y θ̂2 dos estadísticos, funciones de los valores muestrales, X1 , X2 , . . . Xn , que
nos darán los valores extremos del intervalo y el parámetro θ es desconocido.
•α se llama nivel de signicación y es el riesgo de que el intervalo no comprenda el
valor θ que se quiere estimar.
• Los extremos dependen de la muestra seleccionada y, por tanto, θ̂1 y θ̂2 son variables
aleatorias.
• Antes de seleccionar una muestra se puede decir que la probabilidad de que el pará-
metro θ tome algún valor en el intervalo (θ̂1 , θ̂2 ) es igual a 1 − α, armación que no es
correcta después de seleccionar la muestra.
74

Intervalo de conanza para la media de una población normal,


con σ conocida
Sea una población N (µ, σ), en donde el parámetro µ es desconocido y deseamos obtener
un intervalo de conanza para el parámetro µ al nivel de conanza del 100(1 − α) %.
Sabemos que:
X̄ − µ
Z= √ → N (0, 1)
σ/ n
Utilizando la tabla de la distribución N (0, 1) podemos encontrar dos valores −zα/2 y
zα/2 tales que:

" #
X̄ − µ
P −zα/2 ≤ √ ≤ zα/2 = 1 − α P (Z > zα/2 ) = α/2 Z → N (0, 1)
σ/ n
" #
σ σ
P −zα/2 √ ≤ X̄ − µ ≤ zα/2 √ = 1 − α
n n
" #
σ σ
P −X̄ − zα/2 √ ≤ −µ ≤ −X̄ + zα/2 √ = 1 − α
n n
Multiplicando por -1
" #
σ σ
P X̄ + zα/2 √ ≥ µ ≥ X̄ − zα/2 √ = 1 − α
n n

Es equivalente a
" #
σ σ
P X̄ − zα/2 √ ≤ µ ≤ X̄ + zα/2 √ = 1 − α
n n

Luego el intervalo de conanza para el parámetro µ al nivel de conanza del 100(1−α) %


es: " #
σ σ
X̄ − zα/2 √ ≤ µ ≤ X̄ + zα/2 √
n n

Resumen de los intervalos de conanza


Intervalo de conanza para la media µ de una población normal con varianza σ2
conocida. " #
σ σ
X̄ − zα/2 √ ; X̄ + zα/2 √
n n

• EJEMPLO: Un muestra aleatoria extraída de una población normal de varianza


igual a 100, presenta una media muestral de 160. Para n = 144, calcular un
intervalo de conanza del 95 % para estimar la media poblacional. (Sol. [158.37,
161.63])
75

Intervalo de conanza para la media µ de una población normal con varianza σ2


desconocida y n ≤ 30.
" # " #
Ŝ Ŝ S S
X̄ − tn−1;α/2 √ ; X̄ + tn−1;α/2 √ ; X̄ − tn−1;α/2 √ ; X̄ + tn−1;α/2 √
n n n−1 n−1

• EJEMPLO: En una determinada marca de cigarrillos se efectúa un experimento


para comprobar el contenido en alquitrán. A tal n se prueban 20 cigarrillos
elegidos al azar de lotes diferentes y se encuentran los siguientes datos muestrales
para el contenido de alquitrán, expresados en mg : X̄ = 22 Ŝ = 4. Encontrar
un intervalo de conanza del 90 % para el contenido medio de alquitrán en un
cigarrillo de la citada marca. (Sol. [20.45, 23.55])

Intervalo de conanza para la media µ de una población normal con varianza σ2


desconocida y n > 30.
" # " #
Ŝ Ŝ S S
X̄ − zα/2 √ ; X̄ + zα/2 √ ; X̄ − zα/2 √ ; X̄ + zα/2 √
n n n−1 n−1

• EJEMPLO: Se quiere conocer la permanencia media de pacientes en un hospital


con el n de estudiar una posible ampliación del mismo. Se tienen datos referidos
a la estancia expresada en días de 800 pacientes, obteniéndose los siguientes
resultados: X̄ = 8.1 Ŝ = 9. Obtener un intervalo de conanza del 95 % para la
estancia media. (Sol. [7.48, 8.72])
76

Contrastes de hipótesis en poblaciones normales


• Hipótesis estadística. Cualquier armación, verdadera o falsa, sobre alguna caracte-
rística desconocida de la población.

• Contraste de hipótesis. Procedimiento estadístico que investiga la aceptación o re-


chazo de una armación acerca de una o unas características de una población.

• Hipótesis nula, H0 . Es la hipótesis que se quiere contrastar y es, por tanto, la que se
acepta o rechaza como conclusión del contraste.

• Hipótesis alternativa, H1 . Es la hipótesis que nos sitúa frente a H0 , de forma que si


acepta H1 se rechaza H0 , y recíprocamente si se rechaza H1 se acepta H0 .

• Estadístico de contraste. Es una función de la muestra aleatoria simple. Extraída


la muestra, el estadístico tomará un cierto valor, cuya distribución en el muestreo es
conocida si la H0 es verdadera.

• Región de rechazo o crítica. Conjunto de valores del estadístico del contraste que
lleva a la decisión de rechazar la H0 .

• Región de aceptación. Conjunto de valores del estadístico del contraste que lleva a la
decisión de aceptar la H0 .

• Nivel de signicación, α. Probabilidad de rechazar H0 siendo cierta.

• Coeciente de conanza, 1-α. Probabilidad de aceptar H0 siendo cierta.

• Contraste unilateral. Es aquél cuya región crítica está formada por un solo conjunto
de puntos de la recta real.

H0 : µ ≥ µ0 H1 : µ < µ0

H0 : µ ≤ µ0 H1 : µ > µ0
• Contraste bilateral. Es aquél cuya región crítica está formada por dos conjuntos de
puntos de la recta real disjuntos.

H0 : µ = µ0 H1 : µ 6= µ0

Fases para realizar un contraste de hipótesis


Enunciado y determinación de las H0 y H1 .
Elección del nivel de signicación, α.
77

Especicación del tamaño muestral.

Selección del estadístico, cuya distribución en el muestreo es conocida si la H0 es


verdadera.

Determinación de la región crítica.

Cálculo del estadístico para la muestra particular.

Conclusiones de de tipo estadístico y de naturaleza no estadística, como pueden


ser conclusiones biológicas, médicas, químicas, psicológicas, económicas, etc.

Cuadro resumen de los contrastes de hipótesis


Contrastes bilaterales y unilaterales sobre los valores de los parámetros de poblacio-
nes normales basados en estadísticos de distribución conocida que permitirán calcular
regiones críticas a un nivel α dado.

Hipótesis Estadístico Regiones críticas

H0 : µ = µ0 H1 : µ 6= µ0 |Z0 | > zα/2


X̄−µ
H0 : µ ≥ µ0 H1 : µ < µ0 Z0 = √0
σ/ n
→ N (0, 1) Z0 < −zα
H0 : µ ≤ µ0 H1 : µ > µ0 Z0 > zα
(σ conocida)

• EJEMPLO: Se quiere comprobar, con un nivel de signicación 0.05, si una muestra


de tamaño 10, con media muestral 10, procede de una población, que se distribuye
según una N (14, 3). (Sol. No procede de la población)

Hipótesis Estadístico Regiones críticas

H0 : µ = µ0 H1 : µ 6= µ0 |T0 | > tα/2,n−1


X̄−µ0
H0 : µ ≥ µ0 H1 : µ < µ0 T0 = √
Ŝ/ n
→ tn−1 T0 < −tα,n−1
H0 : µ ≤ µ0 H1 : µ > µ0 T0 > tα,n−1
(σ desconocida, n ≤ 30)

• EJEMPLO: Un laboratorio farmaceútico arma que un calmante de su fabricación


quita la jaqueca en 14 minutos en los casos corrientes. Con el n de comprobar esta-
dísticamente esta armación se eligen al azar 18 pacientes con jaqueca y se toma como
78

variable de respuesta en el experimento el tiempo transcurrido entre la administración


del calmante y el momento en que desaparece la jaqueca. Los resultados, en minutos,
en la muestra de pacientes han sido X̄ = 19 Ŝ = 7. Comprobar la armación del
laboratorio a un nivel de signicación 0.05. (Sol. La armación del laboratorio no es
cierta)

Hipótesis Estadístico Regiones críticas

H0 : µ = µ0 H1 : µ 6= µ0 |Z0 | > zα/2


X̄−µ0
H0 : µ ≥ µ0 H1 : µ < µ0 Z0 = √
Ŝ/ n
→ N (0, 1) Z0 < −zα
H0 : µ ≤ µ0 H1 : µ > µ0 Z0 > zα
(σ desconocida, n > 30)

• EJEMPLO: Se quiere comprobar, a un nivel de signicación 0.05, si cien observa-


ciones distribuidas normalmente con cuasidesviación típica 1 y con media muestral 10,
pueden proceder de una población normal N (10.3, σ). (Sol. La muestra no procede de
la población)
DISTRIBUCIÓN t DE STUDENT

Puntos de porcentaje de la distribución t

Ejemplo


Para = 10 grados de
libertad:

P[ t > 1.812] = 0.05


P[ t < -1.812] = 0.05

D
0,25 0,2 0,15 0,1 0,05 0,025 0,01 0,005 0,0005
r
1 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,656 636,578
2 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,600
3 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 12,924
4 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610
5 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869

6 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959


7 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 5,408
8 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041
9 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781
10 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587

11 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437


12 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318
13 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221
14 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140
15 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073

16 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015


17 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965
18 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922
19 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883
20 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850

21 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819


22 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792
23 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,768
24 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745
25 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,725

26 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707


27 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,689
28 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,674
29 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,660
30 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,646

40 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,551


60 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660 3,460
120 0,677 0,845 1,041 1,289 1,658 1,980 2,358 2,617 3,373
0,674 0,842 1,036 1,282 1,645 1,960 2,326 2,576 3,290
80

PROBLEMAS
1. Se sabe que la anchura de las piezas fabricadas por una cierta máquina, medida en
centímetros, se distribuye según una distribución normal de media 10 y desviación
típica 0.25. Si se toma una muestra aleatoria simple de 25 piezas, calcular la
probabilidad de que la media muestral de la anchura de las 25 piezas sea inferior
a 10.1 centímetros (Sol. 0.9772).

2. Se sabe que el peso de los coches de una determinada compañía sigue una dis-
tribución normal con media 1000 Kg. y desviación típica 80 Kg. Para llevar un
control sobre la calidad de sus automóviles, cada día la compañía elige aleatoria-
mente 400 de los coches fabricados. Si el peso medio muestral es inferior a 992
Kg. o superior a 1008 Kg. la compañía considera que la producción está fuera de
control. ¾Cuál es la probabilidad de que un día la producción se encuentre fuera
de control? (Sol. 0.0456)

3. En una determinada marca de antibióticos se efectúa un experimento para com-


probar el contenido en etanol. A tal n se prueban 20 antibióticos elegidos al
azar de lotes diferentes y se encuentran los siguientes datos muestrales para el
contenido de etanol, expresados en mg : X̄ = 22 Ŝ = 4. Encontrar un intervalo
de conanza del 90 % para el contenido medio de etanol en un antibiótico de la
citada marca. (Sol. [20.45, 23.55])

4. Se está estudiando el absentismo laboral de los directivos de una empresa. Se han


elegido al azar 10 directivos de un determinad departamento y se anota el número
de días de falta al trabajo por diversos motivos durante los últimos cuatro meses.
Estos han sido los resultados: 5, 4, 6, 8, 7, 4, 2, 7, 6, 1. Determinar un intervalo de
conanza del 90 % para el número de días de absentismo de los directivos durante
los últimos cuatro meses. (Sol. [3.69, 6.31]; X̄ = 5; Ŝ = 2.26)

5. En una muestra de 37 jóvenes encontramos que el consumo medio de proteí-


nas diario es de 190 gramos y su desviación típica 36 gramos. Con un nivel de
conanza del 95 %, el intervalo de conanza para la media poblacional estará
comprendido aproximadamente entre:

a = 190 ± 36 b = 190 ± 12 c = 190 ± 3 d = 190 ± 6 (Sol.b)

6. La variable altura de las alumnas que estudian en una escuela de idiomas sigue
una distribución normal de media 1.62 m y la desviación típica 0.12 m. ¾Cuál
es la probabilidad de que la media de una muestra aleatoria de 100 alumnas sea
mayor que 1.60 m?. (Sol. 0.9515)

7. Se ha tomado una muestra de los precios de un mismo producto alimenticio en


16 comercios, elegidos al azar en un barrio de una ciudad, y se han encontrado
los siguientes precios:
81

95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110.

Suponiendo que los precios de este producto se distribuyen según una ley normal
de varianza 25. Determinar el intervalo de conanza, al 95 %, para la media
poblacional. (Sol. [101.55, 106.45])

8. Sea X una variable aleatoria distribuida según una N (µ, 3). A partir de la muestra
6, 7, 8, 3, 5, 6, 7, 8, 9, 1, 7, 6, 3, 8, 9, 7, contraste con un nivel de signicación
de 0.05, la hipótesis de que la media real sea 5. (Sol. [4.78, 7.72])

9. Se toma una muestra aleatoria de 10 alumnas de una población de alumnas


universitarias. Se ha estimado de experiencias anteriores que la altura de las
alumnas universitarias constituye una característica que se distribuye según una
variable aleatoria normal de media 167 cm y σ = 3.2 cm. Probabilidad de que
la media muestral de las alturas de las 10 alumnas sea inferior a 165 cm. (Sol.
0.0239)

10. Una agencia de alquiler de automóviles necesita estimar el número medio de


Kilómetros diarios que realiza su ota de automóviles. A tal n, en varios días
de la semana toma los recorridos de 100 vehículos de su ota y obtiene que la
media muestral es de 165 Km/día y la cuasidesviación típica muestral 6 Km/día.
Obtener bajo la hipótesis de normalidad de la característica en estudio (número de
Kilómetros por día), un intervalo de conanza para la media de dicha distribución
a un nivel de conanza del 95 %. (Sol. [163.82,166.18])

11. Unos investigadores están interesados en valorar el nivel medio de hormona tes-
tosterona en pacientes con síndrome adrenogenital, para evaluar si es distinto del
valor en población normal que presenta una distribución de media 7.9 ng/dl (UC)
con una desviación típica de 2.3 ng/dl (UC). Para ello determinan los niveles de
testosterona en 40 pacientes con síndrome adrenogenital y obtienen una media
de 12 ng/dl con una desviación típica de 3 ng/dl. ¾Cuál fue la conclusión de los
investigadores a un nivel de signicación 0.05? (Sol. [11.29, 12.71])

12. El calor emanado, en caloría por gramo, de una mezcla de estiercol, tiene una
distribución aproximadamente normal. Con una muestra de tamaño 9 tomada,
se ha obtenido una media de 105 y una varianza de 5. ¾Podemos aceptar al 95 %
un calor medio de 100 calorías por gramo? (Sol. No. [103.17, 106.82])

13. Para estimar la estatura media de los varones adultos de una población, se tomó
una muestra al azar de 10 de ellos en la que se obtuvo los valores 162, 176, 169,
165, 171, 169, 172, 168, 167, 175 cm. Estimar mediante el intervalo de conanza
oportuno entre qué valores se situará la media de la población, con una conanza
del 95 %. Sol [166, 32; 172, 48]

14. Una emisora de televisión por cable anuncia que el periodo medio de espera desde
la solicitud hasta la conexión a la red de sus nuevos clientes es menor o igual a
82

ocho días. La asociación de consumidores desea vericar dicha hipótesis, para lo


cual ha tomado una muestra del periodo de espera (en días) de 15 clientes con
los siguientes resultados: 11, 8, 10, 13, 8, 10, 12, 12, 8, 10, 11, 7, 10, 7 y 8.

Suponiendo normalidad en los datos, verique si el periodo medio de espera es


menor o igual a ocho días, o si por el contrario dicho periodo medio es superior
a 8 días. (Nivel de signicación α = 0, 05). Sol. La emisora no tiene razón.

También podría gustarte