Está en la página 1de 29

INFERENCIA ESTADÍSTICA

Prof. José Alexy Moros Briceño

1
CONTENIDO
Definición de estadística inferencial _________________________ 3
Estimador ________________________ 4
Propiedades de un estimador_____________________ 5
Estimación puntual ______________________ 7
Estimación por intervalo de confianza ______________________9
Intervalo de confianza para la media poblacional____________________ 10
Intervalo de confianza para la diferencia de medias poblacionales _______________________ 16
Intervalo de confianza para las proporciones poblacionales ______________________ 21
Intervalo de confianza para la varianza poblacional ______________________23

2
Definición de Estadística Inferencial
Es el procedimiento por medio del cual se realiza generalizaciones o inferencias de una población mediante los
resultados que se obtienen a partir de una muestra aleatoria extraída de esa población.

n1
muestra

N n2

Inferencia estadística nk

La inferencia se clasifica en:


1. Estimación: (a) Puntual (b) Intervalo de confianza

2. Prueba de hipótesis

3
Estimador
Es una función de la muestra. Puede definirse como la regla a través de la cual se calcula un valor específico del
estadístico o estimador.
El proceso de estimación implica calcular a partir de la muestra algún estadístico o estimador que se ofrece
como una aproximación del parámetro poblacional.

A continuación, se mencionan los estimadores puntuales más frecuentes:


𝒏
ഥ = σ𝒊=𝟏 𝑿𝒊 se emplea para estimar 𝜇𝑥 y se escribe 𝜇𝑥 = 𝑋.
Media muestral 𝑿 ത
𝒏
σ𝒏 ഥ 𝟐
𝒊=𝟏(𝑿𝒊 − 𝑿)
Varianza muestral 𝑺𝟐 = se emplea para estimar 𝜎𝑥2 y se escribe 𝜎ො 2 = 𝑆 2 .
𝒏−𝟏

σ𝒏 𝟐 ഥ 𝟐
𝒊=𝟏(𝑿𝒊 − 𝑿)
Desviación estándar muestral 𝑺 = se emplea para estimar 𝜎𝑥 y se escribe 𝜎ො𝑥 = 𝑆.
𝒏−𝟏

𝑵° 𝒅𝒆 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒒𝒖𝒆 𝒑𝒐𝒔𝒆𝒆 𝒍𝒂 𝒄𝒂𝒓𝒂𝒄𝒕𝒆𝒓í𝒔𝒕𝒊𝒄𝒂


Proporción muestral 𝒑
ෝ= se emplea para estimar 𝜋 y se escribe 𝜋ො = 𝑝.Ƹ
𝑻𝒐𝒕𝒂𝒍 𝒅𝒆 𝒆𝒔𝒄𝒐𝒈𝒊𝒅𝒐𝒔

Total media poblacional 𝑻 = 𝑵𝑿


ഥ se emplea para estimar el total poblacional 𝜏 y se escribe 𝜏Ƹ = 𝑛𝑥.ҧ

Total proporción poblacional 𝑻 = 𝑵ഥ


𝒑 se emplea para estimar el total poblacional 𝜏 y se escribe 𝜏Ƹ = 𝑛𝑝.ҧ

4
Propiedades de un estimador
Insegado. Se dice que un estimador es insesgado cuando E(𝜃) መ = E(𝜃). Donde 𝜃መ es el estimador 𝜃 y es el
parámetro. Cuando E(𝜃)
መ ≠ E(𝜃), se dice que el estimador es sesgado.

En la práctica es preferible un estimador cuya distribución esté más concentrada alrededor del parámetro que se
está estimando (sesgo = 0).
En la figura se reseña un estimador insesgado y un estimador sesgado

Figura. Representación de un estimador insesgado y un estimador sesgado

La media del estimador 𝜃መ1se ubica sobre la media del parámetro, mientras que la media del estimador 𝜃መ2 se
aleja de la media del parámetro, por lo tanto, 𝜃መ1 es el estimador insesgado de 𝜃

5
Propiedades de un estimador
Eficiente. Se dice que estimador es eficiente cuando al comparar las varianzas de dos estimadores, 𝜃መ1 y 𝜃መ2 , se
tiene que aquel que tenga menor varianza (𝑆 2 ) o menor desviación estándar (𝑆) será el más eficiente.
Consistente. Un estimador es consistente si se aproxima al valor del parámetro cuanto mayor es n (tamaño de
la muestra). Es decir, en la medida que aumenta n el estimador será más consistente. Esto es porque:
E[𝜃መ ]→0 cuando n →∞
Var[𝜃መ ]→0 cuando n →∞
Acá se lee la esperanza matemática del estimador o la varianza del estimador tiende a cero (insesgado) cuando
el tamaño de la muestra (n) tiende a ser grande o infinito.
Suficiente. Se dice que un estimador es suficiente si se utiliza toda la información de la muestra para su calculo.
Por ejemplo, la media muestral sería un estimador suficiente de la media poblacional, mientras que la moda no
lo sería, ya que para el cálculo de media se toma todo el conjunto de datos, mientras que para el cálculo de la
moda basta uno o varios datos.

6
Estimación Puntual
Es cuando a partir de una muestra se calcula un solo valor como estimación de un parámetro poblacional
desconocido.
Así tenemos los parámetros y sus respectivos estimadores:
𝜇Ƹ = 𝑋ത
𝜎ො 2 = 𝑆 2
𝜎ො = 𝑆
𝜋ො = 𝑝ҧ
Para hallar los estimadores hacemos usos de sus respectivas formulas estadísticas.

7
Estimación Puntual
Ejemplo 1. Los siguientes datos corresponden a los pesos (en Kg) de 15 hombres escogidos al azar y que laboran
en una empresa, siendo éstos: 72, 68, 63, 75, 84, 91, 66, 75, 86, 90, 62, 87, 77, 70, 69. Estime el peso promedio y la
desviación estándar.
Solución: Aplicamos las fórmulas estadísticas de la media muestral y desviación estándar muestral:
𝒏
ഥ = σ𝒊=𝟏 𝑿𝒊 = 75,67 Kg.
𝑿 𝒏

σ𝒏 ഥ 𝟐
𝒊=𝟏(𝑿𝒊 − 𝑿)
𝑺= = 9,77 Kg.
𝒏−𝟏

𝜇Ƹ = 𝑋ത = 75,67 𝐾𝑔

𝜎ො = 𝑆 = 9,77 𝐾𝑔
El peso promedio y desviación estándar estimados es de 75,67 kg y 9,77 kg, que es lo mismo decir 75,67 ± 9,77
kg.

8
Estimación por Intervalo de Confianza
La estimación por intervalos es más significativa, porque no se puede esperar que la estimación del estimador (𝜃)

sea igual al parámetro poblacional (𝜃).
En general, el intervalo de confianza se expresa de la siguiente manera:
෡ − 𝒌𝝈𝜽෡ < 𝜽 < 𝜽
𝑷 𝜽 ෡ + 𝒌𝝈𝜽෡ = 𝟏 − 𝜶 %

𝜃መ = valor del estimador


𝜃 = parámetro (que se estima)
𝑘 = coeficiente de confiabilidad (𝑍, 𝑡, 𝑋 2 ) para un determinado nivel de confianza
𝜎𝜃෡ = error estándar del estimador= 𝜎/ 𝑛
𝒌𝝈𝜽෡ =error estándar de estimación
La diferencia 𝜃መ − 𝑘𝜎𝜃෡ ) − (𝜃መ + 𝑘𝜎𝜃෡ = 2𝑘𝜎𝜃෡ se conoce como longitud del intervalo.

9
Intervalo de Confianza para la Media Poblacional
Casos 1. Cuando n ≥ 30, la media muestral sigue una distribución normal, no importa que se conozca o
no la varianza o desviación estándar de la población. En ambos casos se recurre a la distribución normal
estandarizada mediante el teorema del límite central (TLC):

Si se desconoce la varianza o desviación estándar


ഥ −𝝁
𝑿 ഥ−𝝁
𝑿
𝒁= 𝒁= de la población, pero n es mayor o igual a 30, la
𝝈/ 𝒏 𝑺/ 𝒏 media poblacional se estima mediante S.

El intervalo de confianza para un determinado nivel de significancia nos queda:


ഥ−𝒁
𝑷 𝑿 𝜶 ഥ + 𝒁 𝜶 𝝈𝑿ഥ = 𝟏 − 𝜶 %
𝝈𝑿ഥ < 𝝁 < 𝑿
𝟏− 𝟐 (𝟏− )
𝟐

𝑍(1− 𝜎) 𝜎𝑋ത = Error de estimación de la media


2
𝜎
𝜎𝑋ത = = Error estándar de la media
𝑛

1 − 𝛼 % = nivel de confianza

10
Intervalo de Confianza para la Media Poblacional
Como calculamos 𝒁(𝟏− 𝝈
) , veamos el siguiente ejemplo:
𝟐

Supongamos que vamos a trabajar o elegimos un nivel de confianza del 90%.. Se procede de la siguiente
manera:
a. 1 – α = 0,90;
b. El valor Z se calcula de la siguiente manera:
𝟏 − 𝜶 = 𝟎, 𝟗𝟎 → 𝜶 = 𝟎, 𝟏𝟎 → 𝜶/𝟐 = 𝟎, 𝟎𝟓
𝒁(𝟏− 𝝈) = 𝒁(𝟏−𝟎,𝟎𝟓) = 𝒁𝟎,𝟗𝟓
𝟐

c. En la tabla de distribución normal buscamos el valor 0,95


Observe que el cruzar 1,6 con 0,04 y 0,05 se ubica el valor 0,95
Por lo tanto, 𝒁𝟎,𝟗𝟓 = 𝟏, 𝟔𝟒𝟓
También puede hacerse uso de la función =INV.NORM.ESTAND(PROBABILIDAD) de Excel
Para 1 - α = 0,95 𝑍0,975 = 1,96
Queda de su parte verificar si es cierto estos resultados.
Para 1 - α = 0,99 𝑍0,995 = 2,58

11
Intervalo de Confianza para la Media Poblacional
Ejemplo 2. Una muestra aleatoria de 100 propietarios de automóviles en la ciudad de San Cristóbal indica que los
automóviles recorren anualmente un promedio de 25.000 Km con una desviación estándar de 4.000 K. Calcule e
interprete un intervalo de confianza al 95% para el verdadero recorrido promedio anual de los automóviles en esta
ciudad.
Solución
n = 100 propietarios 𝑋ത = 25.000 Km S = 4.000 Km 1 – α = 95%
En este ejercicio, al ser n ≥ 30, pero se desconoce la varianza poblacional se estima el intervalo de confianza de la meda
poblacional mediante 𝑆 2 como estimador de 𝜎 2 , o en su defecto la desviación estándar S.
ഥ−𝒁
𝑷 𝑿 𝜶 ഥ + 𝒁 𝜶 𝑺𝑿ഥ = 𝟏 − 𝜶 %
𝑺𝑿ഥ < 𝝁 < 𝑿
𝟏− 𝟐 (𝟏− )
𝟐
El error estándar 𝑺𝑿ഥ se estima por S/ 𝑛
Y el error de estimación sería 𝒁 𝜶
𝟏− 𝟐
𝑺𝑿ഥ = 1,96 ∗ 4000ൗ 100

4000
𝑃 25.000 − 1,96 ∗ < 𝜇 < 25.000 + 1,96 ∗ 4000/ 100 = 95%
100
𝑷 𝟐𝟒. 𝟐𝟏𝟔 < 𝝁 < 𝟐𝟓. 𝟕𝟖𝟒 = 𝟗𝟓%
Se tiene un 95% de confianza o certeza de que el intervalo del verdadero recorrido promedio anual de la población de
automóviles oscile entre 24.216 y 25.784 Km. 12
Intervalo de Confianza para la Media Poblacional
Caso 2. Cuando n < 30, la media muestral sigue una distribución normal, se desconoce la varianza o
desviación estándar de la población, entonces la media muestral se distribuye según una t-Student .
ഥ−𝝁
𝑿
𝒕= ~𝒕 𝜶, 𝒏 − 𝟏
𝒔/ 𝒏
Siendo n – 1 los grados de libertad
El intervalo de confianza es:
ഥ−𝒕
𝑷 𝑿 𝜶 ഥ+𝒕 𝜶
𝑺𝑿ഥ < 𝝁 < 𝑿 𝑺ഥ = 𝟏 − 𝜶 %
𝟏− 𝟐,𝒏−𝟏 (𝟏− ,𝒏−𝟏) 𝑿
𝟐

𝑡(1− 𝜎;𝑛−1) 𝜎𝑋ത = Error de estimación de la media


2

𝑆
𝑆𝑋ത = = Error estándar estimada de la media
𝑛

1 − 𝛼 % = nivel de confianza

13
Intervalo de Confianza para la Media Poblacional
¿Cómo calculamos el valor de 𝒕(𝟏−𝜶,𝒏−𝟏)?.
𝟐

Supongamos que elegimos un nivel de confianza del 90% y tenemos una muestra de 10 sujetos.
a. 1 – α = 0,90
b. El valor t se calcula de la siguiente manera:
1 - α = 0,90 → α = 0,10 → α/2 = 0,05
𝑡(1− 𝜎, 𝑛−1) = 𝑡(1−0,05;10−1) = 𝑡0,95;9 es equivalente a 𝑡0,05;9 = 1,833
2

c. En la tabla de distribución t buscamos el valor 0,05 con 9 grados de libertad


Observe que el cruzar 9 con 0,05 se ubica el valor 1,833
Por lo tanto, 𝒕𝟎,𝟗𝟓;𝟗 = 𝟏, 𝟖𝟑𝟑

Haciendo uso del Excel =INV.T(PROBABILIDAD;GRADOS DE LIBERTAD)

14
Intervalo de Confianza para la Media Poblacional
Ejemplo 3. El director de una escuela de negocios quiere estimar la cantidad media de horas que los
estudiantes trabajan por semana. De una muestra de 49 estudiantes mostró una media de 24 horas con una
desviación estándar de 4 horas. ¿Cuál es el intervalo de confianza para nivel de confianza del 95%?
Solución
n = 49 𝑋ത = 24 horas S = 4 horas 1 – α = 95%
1 – α = 0,95 → α = 0,05 → 1 – α/2 = 0,975
𝒕(𝟏−𝜶,𝒏−𝟏) = 𝒕 𝟎,𝟗𝟕𝟓;𝟒𝟖 = que es equivalente a 𝑡0,025;48= 2,011
𝟐

4
𝑃 24 − 2,011 ∗ < 𝜇 < 24 + 2,011 ∗ 4/ 49 = 95%
49
𝑷(𝟐𝟐, 𝟖𝟓 < 𝝁 < 𝟐𝟓, 𝟏𝟓) = 𝟗𝟓%
Se tiene que a un 95% de confianza que la cantidad media de horas que los estudiantes trabajan por semana
oscila entre 22,85 y 25,15 ≈ 23 y 25 semanas

15
Intervalo de Confianza para la Diferencia de Medias
Poblacionales
Permite hacer comparaciones entre las medias de dos poblaciones que se distribuyen normalmente. Las
muestras son independientes.
𝜎12
𝑋1 ~𝑁(𝜇1 , 𝜎12 ) 𝑋ത1 ~𝑁 𝜇1 , 𝑛
1

𝜎22
𝑋2 ~𝑁(𝜇2 , 𝜎22 ) 𝑋ത2 ~𝑁 𝜇2 , 𝑛2

Caso 1. Si lo tamaños de muestras n1 y n2 ≥ 30 y las varianza son conocidas, entonces la diferencia de


medias de distribuye normalmente. Se aplica la siguiente fórmula para hallar el intervalo de confianza

𝜎12 𝜎22 𝜎12 𝜎22


P ∆𝑋ത − 𝑍 𝛼
1− 2
∗ + < ∆𝜇 < ∆𝑋ത + 𝑍 𝛼
1− 2
∗ + = 1−α %
𝑛1 𝑛2 𝑛1 𝑛2

∆𝑋ത = Diferencia de medias muestrales 𝑋ത1 − 𝑋ത2 . Aunque también puede ser 𝑋ത2 − 𝑋ത1

16
Intervalo de Confianza para la Diferencia de Medias
Poblacionales
Caso 2. Si lo tamaños de muestras n1 y n2 < 30 y las varianza son desconocidas, entonces se aplica la
distribución t-Student, según dos casos:

a. Si las varianza son iguales: 𝝈𝟐𝟏 = 𝝈𝟐𝟐

𝑺𝟐𝒑 𝑺𝟐𝒑 𝑺𝟐𝒑 𝑺𝟐𝒑


ഥ−𝒕
𝑷 ∆𝑿 𝜶 ∗ + ഥ+𝒕
< ∆𝝁 < ∆𝑿 𝜶 ∗ + = 𝟏−𝜶 %
𝟏− ; 𝒏𝟏 +𝒏𝟐 −𝟐 𝒏𝟏 𝒏𝟐 𝟏− ; 𝒏𝟏 +𝒏𝟐 −𝟐 𝒏𝟏 𝒏𝟐
𝟐 𝟐

𝑆𝑝2 = Varianza conjunta o mancomunada


2 2
𝑛1 − 1 𝑆1 + (𝑛2 − 1)𝑆2
𝑆𝑝2 =
𝑛1 + 𝑛2 − 2

17
Intervalo de Confianza para la Diferencia de Medias
Poblacionales
b. Si las varianza son desiguales: 𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 . Se debe calcular los grados de libertad

𝑆12 𝑆22 𝑆12 𝑆22


P ∆𝑋ത − 𝑡 1−
𝛼 ∗ + < ∆𝜇 < ∆𝑋ത + 𝑡 1−
𝛼 ∗ + = 1−α %
2 𝑛1 𝑛2 2 𝑛1 𝑛2

Calculo de los grados de libertad:


𝑤1 𝑡1 + 𝑤2 𝑡2
𝑡 𝛼
1− 2
=
𝑤1 + 𝑤2

𝑆12 𝑆22
𝑤1 = 𝑤2 =
𝑛1 𝑛2

𝑡1 = 𝑡1−𝛼; 𝑛 𝑡2 = 𝑡1−𝛼; 𝑛
2 1 −1 2 2 −1

18
Intervalo de Confianza para la Diferencia de Medias
Poblacionales
Ejemplo 4. Se están utilizando normalmente en una granja avícola dos tipos de alimentos A y B. Queriendo
comparar la media de engorde con ambos alimentos, para un nivel de confianza 0,90, se alimentan a 20 aves
durante cierto tiempo con el alimento A obteniéndose una ganancia media de peso de 0,40 Kg por ave.
Simultáneamente a otras 19 aves se les alimenta con el alimento B y se obtiene un engorde medio de 0,50 Kg. Se
conoce por experiencias previas que las variables objeto de estudio, engorde con cada uno de los alimentos, son
normales con varianzas de 0,05 para el A y 0,10 para el B. Estimar la diferencia de engorde medio.

Solución 𝑛1 = 20 𝑋ത1 = 0,40 Kg 𝑛2 = 19 𝑋ത2 = 0,50 Kg 1-α = 0,90

𝜎12 = 0,05 𝜎22 = 0,01

Como se conocen las varianza poblaciones, y las muestras se distribuyen normal

𝜎12 𝜎22 𝜎12 𝜎22


P ∆𝑋ത − 𝑍 𝛼
1− 2
∗ + < ∆𝜇 < ∆𝑋ത + 𝑍 𝛼
1− 2
∗ + = 1−α %
𝑛1 𝑛2 𝑛1 𝑛2

19
Intervalo de Confianza para la Diferencia de Medias
Poblacionales
1 - α = 0,90 → α = 0,10 → α/2 = 0,05 → 𝑍 1−
𝛼 = 𝑍0,95 = 1,645
2

∆𝑋ത = 0,40 – 0,50 = -0,10

0,05 0,01 0,05 0,01


P −0,10 − 1,645 ∗ + < ∆𝜇 < −0,10 + 1,645 ∗ + = 90%
20 19 20 19

P −0,24 < ∆𝜇 < 0,04 = 90%

Se estima para un nivel de confianza del 90% que la diferencia del .peso promedio de engorde entre los dos tipos de
alimentos oscila entre -0,24 y 0,04 Kg

20
Intervalo de Confianza para las Proporciones
Poblacionales
Cuando el estimador S es la proporción de éxitos de una muestra aleatoria obtenida de una población binomial
en la que p es la proporción de éxitos, entonces el intervalo de confianza para la proporción está dada por:

ഥ 𝟏−𝒑
𝒑 ഥ ഥ(𝟏 − 𝒑
𝒑 ഥ)
ഥ−𝒁
𝑷 𝒑 𝜶
𝟏− 𝟐
∗ ഥ+𝒁
< 𝝅<𝒑 𝜶
𝟏− 𝟐
∗ = 𝟏−𝜶 %
𝒏 𝒏

𝑝ҧ 1−𝑝ҧ
Esto es porque la proporción muestral sigue una distribución normal, 𝑝~𝑁(𝜋,
ҧ )
𝑛

Si la muestra proviene de una población infinita o finita con reposición, entonces:

ഥ 𝟏−𝒑
𝒑 ഥ 𝑵−𝒏
ഥ±𝒁
𝑷 𝒑 𝜶
𝟏− 𝟐
∗ ∗ = 𝟏−𝜶 %
𝒏 𝑵 −𝟏

Cuando se trata de dos muestras aleatorias:

ഥ𝟏 𝟏 − 𝒑
𝒑 ഥ𝟏 ഥ𝟐 𝟏 − 𝒑
𝒑 ഥ𝟐
ഥ𝟏 ± 𝒑
P 𝒑 ഥ𝟐 ± 𝒁 𝟏−
𝜶 ∗ + = 𝟏−𝜶 %
𝟐 𝒏𝟏 𝒏𝟐

21
Intervalo de Confianza para las Proporciones Poblacionales
Ejemplo 5. Con el propósito de estimar la proporción de estudiantes regulares que asistirán a los cursos
intensos de estadística, el jefe de del Departamento analizó una muestra aleatoria de tamaño 200 estudiantes,
donde 45 de éstos indicaron que asistirían. Construya e interprete un intervalo de confianza al 90% para la
verdadera proporción de los que asistirán al referido curso.
Solución n = 200 x = 45 1 – α = 0,90

𝑝ҧ 1 − 𝑝ҧ 𝑝(1
ҧ − 𝑝)ҧ
P 𝑝ҧ − 𝑍 𝛼
1− 2
∗ < 𝜋 < 𝑝ҧ + 𝑍 𝛼
1− 2
∗ = 1−α
𝑛 𝑛
𝑥 45
Calculando 𝑝ҧ = = = 0,225
𝑛 200

0,225 1 − 0,225 0,225(1 − 0,225)


P 0,225 − 1,645 ∗ < 𝜋 < 0,225 + 1,645 ∗ = 90%
200 𝑛

P 0,175 < 𝜋 < 0,274 = 90%


Se estima en una confianza del 90% que la verdadera proporción de los estudiantes que asistirán al referido
curso de estadística oscila entre 0,175 y 0,274; que multiplicando estos valores por 200 tenemos un intervalo de
estudiantes de 35 y 55. 22
Intervalo de Confianza para la Varianza Poblacional
El intervalo de confianza para la varianza (o desviación estándar) de una población distribuida normalmente,
estimada a partir de la varianza (o desviación estándar) de una muestra aleatoria, viene dado por:

(𝒏 − 𝟏)𝑺𝟐 𝟐
(𝒏 − 𝟏)𝑺𝟐
𝑷 ≤𝝈 ≤ 𝟐 = 𝟏−𝜶 %
𝑿𝟐𝜶 𝑿 𝟏−𝜶Τ𝟐;𝒈𝒍
𝟐 ;𝒈𝒍

El intervalo de confianza para la desviación estándar es:

(𝒏 − 𝟏)𝑺𝟐 (𝒏 − 𝟏)𝑺𝟐
𝑷 ≤𝝈≤ = 𝟏−𝜶 %
𝑿𝟐𝜶 𝑿𝟐 𝟏−𝜶Τ𝟐;𝒈𝒍
𝟐 ;𝒈𝒍

La distribución muestral de la varianza sigue una distribución chi cuadrado (𝑋 2 ) con grados de liberad n-1, es
decir, 𝑆 2 ~𝑋 2 (𝑛 − 1)

23
Intervalo de Confianza para la Varianza Poblacional
Por definición, una distribución chi cuadrado o ji cuadrado (𝑋 2 )es:
2
(𝑛 − 1)𝑆
𝑋2 =
𝜎2
La representación gráfica sería:

1−𝛼
𝛼/2
𝛼/2
2
𝑋1−𝛼 𝑋𝛼2;𝑛−1
2 ;𝑛−1 2

2
𝑋1−𝛼
;𝑛−1
es un valor de la distribución chi cuadrado que deja un área de 1-α/2 a la izquierda de la curva.
2

𝑋𝛼2;𝑛−1 es un valor que deja un área de α/2 a la derecha de la curva.


2

24
Intervalo de Confianza para la Varianza Poblacional
Para el calculo de los valores de 𝑋 2 se hace de la tabla de esta distribución. Veamos unos ejemplos:
1. Dada una variable aleatoria 𝑋 2 con 15 grados de libertad, hallar el valor que deja un área de 0,01 a la derecha.
α = 0,01

Como debe hallarse solo un área, el alfa no se divide

1 − 𝛼 = 0,99
0,01
2
𝑋0,01;15 = 30,58

=INV.CHICUAD.CD(PROBABILIDAD;GRADOS DE LIBERTAD)
25
Intervalo de Confianza para la Varianza Poblacional
2. Dada una variable aleatoria 𝑋 2 con 15 grados de libertad, hallar el valor que deja un área de 0,01 a la
izquierda. α = 0,01

1 − 𝛼 = 0,99
0,01

2
𝑋0,99;15 = 5,229

En este caso, como se pide calcular el Chi cuadrado que deja a la izquierda un área de 0,01, debemos tomar en
la tabla (1 – 0,01) = 0.99, porque la distribución 𝑋 2 no es simétrica; realizándose el mismo procedimiento del
ejercicio anterior.

=INV.CHICUAD(PROBABILIDAD;GRADOS DE LIBERTAD) en el valor de probabilidad de introduce el resultado de


la diferencia 1 − 𝛼; en este caso INV.CHICUAD(0,01;15)
26
Intervalo de Confianza para la Varianza Poblacional
3. Dada una variable aleatoria 𝑋 2 con 15 grados de libertad, hallar el valor que deja un área de 0,01 en ambos
extremos. α = 0,01

Como debe hallarse en ambos extremos, el alfa se


divide por dos.

0,99
0,005
0,005
2
𝑋1−𝛼
;𝑛−1
= 𝑋𝛼2;𝑛−1 =
2 2
4,60 32,8
2 2 2
𝑋1−𝛼 = 𝑋1−0,005;15 = 𝑋0,995;15 = 4,60
;𝑛−1
2

𝑋𝛼2;𝑛−1 = 𝑋0,005;15
2
= 32,8
2

27
Intervalo de Confianza para la Varianza Poblacional
Ejemplo 6. A cada uno de los miembros de una muestra de 20 estudiantes de enfermería se les hizo una prueba
estandarizada para medir su nivel de responsabilidad. Se obtuvo una varianza muestral de 12. Construir el
intervalo de confianza del 95% para la varianza y desviación estándar de la población.
Solución 𝑆 2 = 12 𝐼𝐶 𝑎𝑙 95% 𝑝𝑎𝑟𝑎 𝜎 2 𝑦 𝜎
𝛼
𝑔𝑙 = 𝑛 − 1 = 20 − 1 = 19 1 − 𝛼 = 0,95 𝛼 = 0,05 = 0,025
2

(𝑛 − 1)𝑆 2 2
(𝑛 − 1)𝑆 2
𝑃 ≤𝜎 ≤ 2 =1−𝛼
𝑋𝛼2 𝑋 1−𝛼Τ2;𝑔𝑙
2 ;𝑔𝑙

𝑋𝛼2;𝑔𝑙 = 𝑋0,025;19
2
= 32,852 𝑋 21−𝛼Τ2;𝑔𝑙 = 𝑋 2 0,975;19 = 8,907
2

20 − 1 12 20 − 1 12
𝑃 ≤ 𝜎2 ≤ = 95%
32,852 8,907
𝑃 6,94 ≤ 𝜎 2 ≤ 25,60 = 95%
Se tiene a un 95% de confianza de que la varianza poblacional en la prueba de responsabilidad esté entre 6,94 y
25,6.
28
Intervalo de Confianza para la Varianza Poblacional
Extrayéndole a raíz cuadrada a la expresión anterior, obtenemos el IC de la desviación estándar

𝑃 2,63 ≤ 𝜎 ≤ 5,06 = 95%

Se tiene a un 95% de confianza de que la desviación estándar poblacional en la prueba de responsabilidad esté
entre 2,63 y 5,60.

29

También podría gustarte