Está en la página 1de 27

Unidad 4: Inferencia sobre medias:

Intervalo de confianza y ensayos de


hipótesis con desvío conocido.
Intervalo de confianza y ensayos de
hipótesis con desvío desconocido.
Intervalos de confianza: Generalidades

En la estimación puntual no puede conocerse el error que comete el estimador, es decir


su diferencia con respecto al parámetro, porque no se conoce el verdadero valor del
parámetro. Además, dicho error es aleatorio porque el estimador lo es. Lo que
intentaremos, mediante la técnica de los intervalos de confianza, es acotar dicho error,
esto es, tratar de dar un valor máximo y un valor mínimo para el parámetro
desconocido.
Sea 𝜃 el parámetro desconocido. Trataremos de calcular dos valores 𝐴 y 𝐵 tales que:

𝑃 𝐴 <𝜃 <𝐵 = 1−𝛼

Donde (1 − 𝛼) es una probabilidad elevada, del 80% o más, denominada nivel de


confianza y 𝛼 una probabilidad pequeña, denominada nivel de riesgo, que sería la
probabilidad de que el intervalo no contenga al parámetro.
La expresión del intervalo de confianza significa lo siguiente: Si repitiéramos el
muestreo, en cada muestra obtendríamos un intervalo 𝐴; 𝐵 diferente, pero la fracción
(1 − 𝛼) de las muestras tomadas arrojarán intervalos que contendrán al parámetro. Es
decir, que los límites de confianza 𝐴 y 𝐵 son variables aleatorias del muestreo y en el
(1 − 𝛼).100% de las veces obtendremos muestras que conducirán a intervalos que
contengan al parámetro.

2
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Veámoslo gráficamente: Si el nivel de confianza es del 90%, de 20 intervalos habrá 18
intervalos que contengan al verdadero valor del parámetro (fijo y desconocido) y sólo 2
que no lo contendrán.

Analicemos las siguientes expresiones:


Límite inferior
Límite superior
Límites fijos aleatorio aleatorio
Número Nivel de
𝑃 𝑎 < 𝑋 < 𝑏 = 1 − 𝛼 entre 0 y 1 𝑃 𝐴<𝜃 <𝐵 =1−𝛼
confianza

Variable aleatoria Parámetro fijo

3
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Intervalo de confianza para la media μ de una población normal con σ conocido.

La variable 𝑋ത es el estimador muestral de la media poblacional μ.


𝐸(𝑋)=μ
𝜎2 𝜎

𝑉𝑎𝑟(𝑋)= ֜ 𝜎𝑋ത =
𝑛 𝑛

Sea 𝑥1 , 𝑥2 , … , 𝑥𝑛 una muestra aleatoria de la variable aleatoria 𝑋 que sigue una


1
distribución normal. Entonces 𝑥1 , 𝑥2 , … , 𝑥𝑛 son independientes y 𝑋ത = 𝑛 . (𝑥1 + 𝑥2 +
… + 𝑥𝑛 ) también sigue una distribución normal.
Si la variable aleatoria 𝑋 no fuese normal, también podremos esperar que 𝑋ത tenga una
distribución aproximadamente normal si el tamaño de la muestra fuese lo
suficientemente grande (𝑛 ≥ 30), de acuerdo al teorema central del límite.
Por lo tanto, podemos estandarizar a la variable 𝑋ത para obtener una variable normal
estándar:
𝑋ത − μ
𝑍= 𝜎 𝛼 𝛼
1−𝛼
𝑛 2 2
𝑍
𝑃 𝑍𝛼 ≤ 𝑍 ≤ 𝑍1− 𝛼 = 1 − 𝛼 𝑍𝛼 0 𝑍1−𝛼
2 2 2 2
4
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Remplazando en la expresión por que vale 𝑍 y operando algebraicamente para despejar
el parámetro en el centro de la expresión:

𝑋ത − μ
𝑃 𝑍𝛼 ≤ 𝜎 ≤ 𝑍1− 𝛼 = 1 − 𝛼
2 2
𝑛 𝜎
siempre es positivo
𝑛
𝜎 𝜎
𝑃 𝑍𝛼 . ത
≤ 𝑋 − μ ≤ 𝑍1− 𝛼 . =1−𝛼
2 𝑛 2 𝑛

𝜎 𝜎
𝑃 −𝑋ത + 𝑍𝛼 . ≤ −μ ≤ −𝑋ത + 𝑍1− 𝛼 . =1−𝛼
2 𝑛 2 𝑛
Multiplicando por -1 se dan
𝜎 𝜎 vuelta las desigualdades
𝑃 𝑋ത − 𝑍𝛼 . ത
≥ μ ≥ 𝑋 − 𝑍1− 𝛼 . =1−𝛼
2 𝑛 2 𝑛
𝑍𝛼 = −𝑍1− 𝛼 y reordenamos
2 2
𝜎 𝜎
𝑃 𝑋ത − 𝑍1− 𝛼 . ≤ μ ≤ 𝑋ത + 𝑍1− 𝛼 . = 1−𝛼 los límites
2 𝑛 2 𝑛

Expresión del intervalo de confianza para 𝛍 con 𝝈 conocido.

5
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
La semi amplitud del intervalo de confianza es:

𝜎
𝐸 = 𝑍1− 𝛼 .
2 𝑛
Y disminuye al aumentar el tamaño de la muestra. Vamos a denominar 𝐸, error máximo
probable del muestreo.
Un problema que se presenta con frecuencia es la determinación del tamaño de la
muestra necesario para obtener un error estipulado, con un nivel de confianza dado:
despejando n de la expresión anterior, obtenemos:
𝑍 𝛼 .𝜎 2
1− 2
𝑛= , que debe redondearse al entero superior para no superar el error
𝐸
máximo que se pide.

6
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Ensayos de hipótesis: Generalidades
Una hipótesis es una suposición o conjetura sobre la naturaleza, cuyo valor de verdad o
falsedad no se conoce. Una hipótesis estadística es una hipótesis sobre una población
estadística o sobre un fenómeno aleatorio.
La hipótesis estadística se refiere en general a la población y no a la muestra. Sin
embargo, el análisis para tratar de comprobar la verdad o falsedad de la hipótesis se
realizará sobre la muestra.
Definición 1: Se llama hipótesis estadística a cualquier suposición o enunciado provisorio
que se realiza sobre una población o fenómeno aleatorio, cuyo valor de verdad o
falsedad no se conoce.
Definición 2: Se llama ensayo de hipótesis al procedimiento que se sigue para tratar de
averiguar si una hipótesis es verdadera o falsa.
Definición 3: Se llama hipótesis nula a la hipótesis objeto del ensayo. Es aquella que se
plantea con vistas a su posible rechazo.
Como la conclusión del ensayo de hipótesis se realiza sobre los resultados muestrales,
dicha conclusión está sujeta a error: un ensayo puede concluir que la hipótesis nula es
falsa y, sin embargo, ésta es verdadera. O bien, se puede concluir que no hay pruebas de
que la hipótesis nula sea falsa, y sin embargo, ésta es falsa.
Un ensayo no puede concluir que una hipótesis nula sea verdadera, sino que no hay
pruebas de que sea falsa. La hipótesis nula NUNCA SE ACEPTA: se rechaza o no se
rechaza. 7
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Cuando un ensayo concluye que una hipótesis nula es falsa, diremos que rechaza la
hipótesis o que ha dado resultado significativo en contra de ella.
Definición 4: Se llama error de tipo I a rechazar una hipótesis nula que en realidad es
verdadera. Se tratará de que este suceso tenga baja probabilidad.
Cuando el ensayo no rechaza, diremos que no hay pruebas concluyentes en contra de
la hipótesis, pero no quedará probado que la hipótesis sea verdadera. En cambio, si se
rechaza la hipótesis nula, quedara (casi) probada que es falsa.
LA CONCLUSIÓN FUERTE DE UN ENSAYO DE HIPÓTESIS, ÚNICAMENTE SE TIENE EN EL
RECHAZO DE LA HIPÓTESIS NULA.
Definición 5: Se llama error de tipo II a no rechazar una hipótesis nula que en realidad es
falsa. Se denota con la letra griega 𝛽 y, dado que la hipótesis nula es falsa, debe quedar
indicado cuál es el valor que se supone verdadero. De manera que siempre
denotaremos 𝛽(𝜇1 ) indicando cuál es el valor del 𝜇1 alternativo para el cuál se calcula el
error de tipo II.
En general, para rechazar una hipótesis nula, debe haber pruebas concluyentes en su
contra; de lo contrario, la hipótesis nula no se rechaza y se dirá que no hay pruebas
concluyentes que prueben su falsedad.

Es interesante en este punto ver la analogía jurídica del ensayo de hipótesis.

8
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Analogía jurídica del ensayo de hipótesis:
𝐻0 : 𝐸𝑙 𝑎𝑐𝑢𝑠𝑎𝑑𝑜 𝑒𝑠 𝑖𝑛𝑜𝑐𝑒𝑛𝑡𝑒
𝐻𝑎 : 𝐸𝑙 𝑎𝑐𝑢𝑠𝑎𝑑𝑜 𝑒𝑠 𝑐𝑢𝑙𝑝𝑎𝑏𝑙𝑒
Error de tipo I: condenar a un inocente (rechazar 𝐻0 siendo verdadera)
Error de tipo II: absolver a un culpable (no rechazar 𝐻0 siendo falsa)
El diseño de un ensayo de hipótesis es siempre tal que el error de tipo I sea el más grave
de los dos. (Sería más grave condenar a un inocente que absolver a un culpable).
Para aquellos que no estén convencidos de que es más grave condenar a un inocente,
sea cual fuere el caso, piensen que en la condena al inocente se comete un doble error:
se está dejando en libertad al verdadero culpable y se está encarcelando a un inocente.
En el caso de la absolución a un culpable se comete ese único error.

Definición 6: Se llama nivel de significación de un ensayo de hipótesis a la máxima


probabilidad de cometer un error de tipo I. Se designa con la letra griega 𝛼 y lo
determina quien diseña el ensayo. Frecuentemente se fija 𝛼 = 0,05.
Definición 7: Se llama regla de decisión a la indicación del curso de acción a seguir
cuando se rechaza, o no, una hipótesis nula.
Definición 8: Se llama potencia del ensayo a la probabilidad de rechazar una hipótesis
nula que es falsa. Se denota como 𝜋 𝜇1 = 1 − 𝛽(𝜇1 ). La potencia y el error de tipo II
son complementarias.
9
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
El siguiente cuadro resume las decisiones correctas y la decisiones incorrectas de
cualquier ensayo de hipótesis:

H0 verdadera H0 falsa
Rechazo H0 Error de tipo I: 𝛼 Potencia: 𝜋 = 1 − 𝛽
Decisión incorrecta (DI) Decisión correcta (DC)
No rechazo H0 Nivel de confianza: 1 − 𝛼 Error de tipo II: 𝛽
Decisión correcta (DC) Decisión incorrecta (DI)

10
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Ensayo de hipótesis sobre la media μ con σ conocido
Vamos a tener dos tipos de ensayos de hipótesis: unilaterales y bilateral.
Ensayo unilateral a cola derecha.
No rechazo 𝐻0
𝐻0 : 𝜇 ≤ 𝜇0
𝐻𝑎 : 𝜇 > 𝜇0 ¡CUIDADO! El valor Región crítica
𝜎 crítico es parte de la
𝐶. 𝑅. : 𝑋ത ≥ 𝑋ത𝐶 = 𝜇0 + 𝑍1−𝛼 . región de rechazo. 𝛼
𝑛 1−𝛼
Error de tipo II y potencia
𝜇0 𝑋ത𝐶 𝑋ത
𝛽 𝜇1 = 𝑃(𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝐻0 \𝐻0 𝑓𝑎𝑙𝑠𝑎
𝑦 𝜇1 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎) 𝛽(𝜇1 )
𝜋(𝜇1 )
𝛽 𝜇1 = 𝑃 𝑋ത < 𝑋ത𝐶 \𝜇 = 𝜇1
𝑋ത𝐶 − 𝜇1
𝛽 𝜇1 = ϕ 𝑍 = 𝜎
ൗ 𝑛 𝜇1 𝑋ത
𝜋 𝜇1 = 𝑃 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 \𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎 𝑦 𝜇1 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎
𝑋ത𝐶 − 𝜇1
𝜋 𝜇1 = 𝑃 𝑋ത ≥ 𝑋ത𝐶 \𝜇 = 𝜇1 = 1 − ϕ 𝑍 = 𝜎 Es el complemento de 𝛽 𝜇1
ൗ 𝑛
11
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Nivel de significación a posteriori

Con el valor de 𝑋ത de la muestra puede calcularse el nivel de significación empírico o


exacto al que denotamos 𝛼 ∗ y llamaremos nivel de significación a posteriori. Es un área
bajo la curva, rayada en líneas rojas en el gráfico, que puede compararse con el 𝛼
teórico, sombreada de azul. Cada muestra tendrá un único valor de 𝑋ത a partir del cual se
puede calcular el 𝛼 ∗ para decidir si con esa muestra se rechaza o no la hipótesis nula.
La regla de rechazo universal, válida para cualquier ensayo de hipótesis es la siguiente:
Si 𝛼 ∗ ≤ 𝛼 se rechaza 𝐻0

Para calcular el nivel de significación a posteriori: No rechazo 𝐻0


𝛼 ∗ = 𝑃(𝑋ത ≥ 𝑋ത𝑚𝑢𝑒𝑠𝑡𝑟𝑎 \𝜇0 ) Región crítica
𝛼 ∗ = 1 − 𝑃(𝑋ത ≤ 𝑋ത𝑚𝑢𝑒𝑠𝑡𝑟𝑎 \𝜇0 )
𝛼∗ 𝛼
1−𝛼
𝑋ത𝑚𝑢𝑒𝑠𝑡𝑟𝑎 − 𝜇0
𝛼∗ =1−ϕ 𝑍 = 𝜎 𝜇0 𝑋ത𝐶 𝑋ത
ൗ 𝑛
𝑋ത𝑚𝑢𝑒𝑠𝑡𝑟𝑎

12
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Ensayo de hipótesis sobre la media μ con σ conocido
Ensayo unilateral a cola izquierda.
No rechazo 𝐻0
𝐻0 : 𝜇 ≥ 𝜇0
𝐻𝑎 : 𝜇 < 𝜇0 Región crítica
𝜎
𝐶. 𝑅. : 𝑋ത ≤ 𝑋ത𝐶 = 𝜇0 − 𝑍1−𝛼 . 𝛼 1−𝛼
𝑛
Error de tipo II y potencia
𝑋ത𝐶 𝜇0 𝑋ത
𝛽 𝜇1 = 𝑃(𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟𝐻0 \𝐻0 𝑓𝑎𝑙𝑠𝑎
𝑦 𝜇1 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎)
𝜋(𝜇1 ) 𝛽(𝜇1 )
𝛽 𝜇1 = 𝑃 𝑋ത > 𝑋ത𝐶 \𝜇 = 𝜇1
𝑋ത𝐶 − 𝜇1
𝛽 𝜇1 = 1 − ϕ 𝑍 = 𝜎
ൗ 𝑛 𝜇1 𝑋ത
𝜋 𝜇1 = 𝑃 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 \𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎 𝑦 𝜇1 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎
𝑋ത𝐶 − 𝜇1
𝜋 𝜇1 = 𝑃 𝑋ത ≤ 𝑋ത𝐶 \𝜇 = 𝜇1 = ϕ 𝑍 = 𝜎 Es el complemento de 𝛽 𝜇1
ൗ 𝑛
13
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Nivel de significación a posteriori
Para calcular el nivel de significación a posteriori:

𝛼 ∗ = 𝑃(𝑋ത ≤ 𝑋ത𝑚𝑢𝑒𝑠𝑡𝑟𝑎 \𝜇0 ) No rechazo 𝐻0

Región crítica

𝑋ത𝑚𝑢𝑒𝑠𝑡𝑟𝑎 − 𝜇0
𝛼 =ϕ 𝑍= 𝜎
ൗ 𝑛 𝛼 𝛼∗ 1−𝛼

𝑋ത𝐶 𝜇0 𝑋ത
𝑋ത𝑚𝑢𝑒𝑠𝑡𝑟𝑎

14
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Ensayo de hipótesis sobre la media μ con σ conocido No rechazo 𝐻0
Ensayo bilateral.
𝐻0 : 𝜇 = 𝜇0
Región crítica Región crítica
𝐻𝑎 : 𝜇 ≠ 𝜇0
𝜎 𝛼 1−𝛼 𝛼
𝐶. 𝑅. : 𝑋ത ≤ 𝑋ത𝐶1 = 𝜇0 − 𝑍1− 𝛼 . 𝑜 2 2
2 𝑛
𝑋ത ≥ 𝑋ത𝐶2 = 𝜇0 + 𝑍1− 𝛼 .
𝜎 𝑋ത𝐶1 𝜇0 𝑋ത𝐶2 𝑋ത
2 𝑛
𝛽(𝜇1 )
Error de tipo II y potencia
𝜋(𝜇1 ) 𝜋(𝜇1 )
𝛽 𝜇1 = 𝑃 𝑋ത𝐶1 < 𝑋ത < 𝑋ത𝐶2 \𝜇 = 𝜇1

𝑋ത𝐶2 − 𝜇1 𝑋ത𝐶1 − 𝜇1 𝜇1 𝑋ത
𝛽 𝜇1 =ϕ 𝑍= 𝜎 −ϕ 𝑍 = 𝜎
ൗ 𝑛 ൗ 𝑛

𝜋 𝜇1 = 𝑃 𝑋ത ≤ 𝑋ത𝐶1 \𝜇 = 𝜇1 + 𝑃 𝑋ത ≥ 𝑋ത𝐶2 \𝜇 = 𝜇1

𝑋ത𝐶1 − 𝜇1 𝑋ത𝐶2 − 𝜇1
𝜋 𝜇1 =ϕ 𝑍= 𝜎 +1−ϕ 𝑍 = 𝜎
ൗ 𝑛 ൗ 𝑛

15
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Nivel de significación a posteriori
Para calcular el nivel de significación a posteriori si el 𝑋ത es menor a 𝜇0 :
𝛼∗ No rechazo 𝐻0
= 𝑃(𝑋ത ≤ 𝑋ത𝑚1 \𝜇0 )
2
𝛼∗ 𝑋ത𝑚1 − 𝜇0 Región crítica Región crítica
=ϕ 𝑍= 𝜎
2 ൗ 𝑛
𝛼 𝛼∗ 1−𝛼 𝛼∗ 𝛼


𝑋ത𝑚1 − 𝜇0
𝛼 = 2 .ϕ 𝑍 = 𝜎
ൗ 𝑛 𝑋ത𝐶1 𝜇0 𝑋ത𝐶2 𝑋ത
𝑋ത𝑚1 𝑋ത𝑚2
Para calcular el nivel de significación a posteriori si el 𝑋ത es mayor a 𝜇0 :
𝛼∗
= 𝑃(𝑋ത ≥ 𝑋ത𝑚𝑢𝑒𝑠𝑡𝑟𝑎 \𝜇0 )
2
El 𝑋ത𝑚𝑢𝑒𝑠𝑡𝑟𝑎 es único. Aquí están
𝛼 ∗
𝑋ത𝑚2 − 𝜇0 representados dos valores, uno
=1−ϕ 𝑍 = 𝜎
2 ൗ 𝑛 menor y otro mayor a la media del
ensayo, para que vean cómo se

𝑋ത𝑚2 − 𝜇0 calcula en cada caso.
𝛼 =2. 1−ϕ 𝑍 = 𝜎
ൗ 𝑛
16
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Cálculo de tamaño de muestra

Para calcular el tamaño de muestra para un nivel de confianza 1 − 𝛼 (o de


significación, 𝛼) y un nivel dado de error de tipo II o potencia usaremos las siguientes
fórmulas, dependiendo de que el ensayo sea unilateral o bilateral.

Ensayos unilaterales

2
𝑍1−𝛼 + 𝑍1−𝛽 . 𝜎
𝑛=
𝜇1 − 𝜇2
En ambos casos se redondea al entero
inmediato superior. El tamaño de muestra
Ensayo bilateral
NUNCA debe expresarse en decimales.
2
𝑍1− 𝛼 + 𝑍1−𝛽 . 𝜎
2
𝑛=
𝜇1 − 𝜇2

¡ATENCIÓN! Nunca debe despejarse el tamaño de muestra de la expresión en la que se


calcula potencia o error de tipo II.

17
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Curvas
Curva de rechazo de 𝐻0 : curva de potencia.
Curva de no rechazo de 𝐻0 : curva característica de operación.
Para 𝐻0 : 𝜇 ≤ 𝜇0
𝐻𝑎 : 𝜇 > 𝜇0
(1 − 𝛼)
Curva de potencia 𝜋 La potencia aumenta hacia el lado
de la hipótesis alternativa. Cuanto
0,50 más me alejo del valor 𝜇0 hacia el
lado de hipótesis alternativa, más
𝛼 Curva característica alta es la probabilidad de rechazar
de operación 𝛽 la hipótesis nula.
𝜇0 𝑋ത𝐶 𝜇

](
𝐻0 verdadera 𝐻0 falsa

Curva de decisiones correctas

Curva de decisiones incorrectas

18
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Curvas
Curva de rechazo de 𝐻0 : curva de potencia.
Curva de no rechazo de 𝐻0 : curva característica de operación.
Para 𝐻0 : 𝜇 ≥ 𝜇0
𝐻𝑎 : 𝜇 < 𝜇0
(1 − 𝛼) Curva característica La potencia aumenta hacia el lado
de operación 𝛽 de la hipótesis alternativa. Cuanto
0,50 más me alejo del valor 𝜇0 hacia el
lado de hipótesis alternativa, más
𝛼 alta es la probabilidad de rechazar
Curva de potencia 𝜋 la hipótesis nula.
𝑋ത𝐶 𝜇0 𝜇

)[
𝐻0 falsa 𝐻0 verdadera

Curva de decisiones correctas

Curva de decisiones incorrectas

19
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Curvas En el ensayo bilateral, las curvas no se cortan en los valores críticos. Si un
valor 𝜇1 coincidiera con 𝑋ത𝐶1 , por ejemplo, la potencia estaría repartida
Para 𝐻0 : 𝜇 = 𝜇0 50% a su izquierda y una pequeña cola a la derecha de 𝑋ത𝐶2 . Por lo tanto,
𝐻𝑎 : 𝜇 ≠ 𝜇0 la potencia es mayor a 0,50 en los valores de los críticos. En la práctica,
generalmente esa pequeña cola hacia el otro lado suele tener una
probabilidad muy baja, casi despreciable.
(1 − 𝛼)
Curva de potencia 𝜋

0,50

𝛼
Curva característica de operación 𝛽
𝑋ത𝐶1 𝜇0 𝑋ത𝐶2 𝜇
()
𝐻0 falsa 𝐻0 falsa
𝐻0 verdadera

Curva de decisiones correctas


Curva de decisiones incorrectas

20
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Intervalo de confianza para la media μ de una población normal con σ desconocido.
Cuando 𝜎 no se conoce, debemos estimarlo con S (el desvío muestral) y el estadístico
queda de la siguiente manera:

𝑋−μ
𝑡= 𝑆
𝑛

Este estadístico tiene una distribución t de Student con ν = 𝑛 − 1 grados de libertad.


La distribución t de Student es la distribución de probabilidad del cociente:
𝑍 ν
𝑡ν = , con 𝐸 𝑡ν = 0 y Var 𝑡ν = ν−2
ᵡ2
ν
ν
Utilizando esta distribución, los límites de confianza para μ se calculan mediante:
𝑆 𝑆
𝑃 𝑋ത − 𝑡ν , 1− 𝛼 . ത
≤ μ ≤ 𝑋 + 𝑡ν , 1− 𝛼 . =1−𝛼 𝑡ν , 𝛼 = −𝑡ν , 1− 𝛼
2 𝑛 2 𝑛 2 2

Expresión del intervalo de confianza para 𝛍 con 𝝈 desconocido.


Es la misma expresión que antes, sólo cambiamos a 𝑍 por 𝑡 y utilizamos el desvío
muestral 𝑆 en lugar del desvío poblacional 𝜎.
La semi amplitud del intervalo de confianza, que también llamaremos error de
muestreo, es:
𝑆
𝐸 = 𝑡ν , 1− 𝛼 .
2 𝑛
21
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
De aquí se puede obtener el tamaño de muestra necesario para obtener una semi
amplitud dada:
𝑡ν , 1− 𝛼 . 𝑆 2
2
𝑛=
𝐸
Se tienen dos inconvenientes: el valor de 𝑆 que aparece en la fórmula es el desvío
estándar de la muestra que todavía no se ha tomado, ya que precisamente, se está
tratando de calcular su tamaño 𝑛. Por otra parte, el fractil 𝑡ν , 1− 𝛼 de la t de Student
2
depende de 𝑛, ya que ν = 𝑛 − 1, así que la incógnita está a ambos lados de la ecuación.
La solución será usar un 𝑆 de una estimación previa o muestra piloto, o un valor
estimado subjetivamente por alguien que conozca razonablemente la variable. El
problema del fractil se resuelve mediante un procedimiento iterativo.
Para iniciar la iteración hay dos opciones, o bien se considera un tamaño de muestra
inicial, 𝑛1 , lo suficientemente grande y se usa 𝑍 en lugar de 𝑡, o bien se considera un
tamaño de muestra un poco por encima del tamaño de muestra que se tenía
originalmente y se utiliza 𝑡. El valor resultante de cada iteración se redondea siempre al
entero superior. Los tamaños de muestra NUNCA se expresan con decimales.
𝑍 𝛼.𝑆 2 𝑡 𝛼. 𝑆 2
1− 2 ν , 1− 2
𝑛1 = 𝐸
o bien: 𝑛1 = 𝐸
Los grados de libertad se calculan a
partir de un n un poco más grande
que el que teníamos originalmente.
22
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
𝑡 𝛼 .𝑆 2 𝑡 𝛼 .𝑆 2
𝑛1 −1 1− 2 𝑛2 −1 1− 2
𝑛2 = ; 𝑛3 =
𝐸 𝐸

Y así sucesivamente hasta que dos iteraciones sucesivas arrojen el mismo tamaño de
muestra.


𝑋−μ
Cuando 𝑋~𝑁𝑜𝑟𝑚𝑎𝑙, 𝑡 = 𝑆 ~𝑡 𝑆𝑡𝑢𝑑𝑒𝑛𝑡
𝑛
Si 𝑋 no sigue una distribución normal, cuando 𝑛 sea lo suficientemente grande,
mediante el uso del teorema central del límite podremos decir que dicho estadístico
sigue aproximadamente una distribución 𝑡 𝑆𝑡𝑢𝑑𝑒𝑛𝑡.
¡ATENCIÓN!: Siempre que se pida uno solo de los límites del intervalo con cierto nivel de
confianza, deberá aplicarse todo el nivel de confianza a ese único límite.
Gráficamente: 𝛼 𝛼
2 2
LI 1−𝛼 LS

Si nos piden un nivel de confianza del 90% para estimar el límite inferior, por ejemplo,
esto quiere decir que por encima del límite inferior hay un 90% de probabilidad. Pero
𝛼
por debajo, el 10% restante no es igual a 𝛼, sino a . Es por eso que en la expresión del
2
𝛼
intervalo de confianza, 1 − vale 0,90. Se procede de la misma manera si nos pidieran
2
el límite superior, y esto es válido para cualquier intervalo de confianza.
23
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Ensayo de hipótesis sobre la media μ con σ desconocido
De la misma manera que en los intervalos de confianza, si 𝜎 es desconocido debemos
usar la distribución t de Student y reemplazar 𝜎 con 𝑆.
Ensayo unilateral a cola derecha Ensayo unilateral a cola izquierda
𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 ≥ 𝜇0
𝐻𝑎 : 𝜇 > 𝜇0 𝐻𝑎 : 𝜇 < 𝜇0
𝑆 𝑆
𝐶. 𝑅. : 𝑋ത ≥ 𝑋ത𝐶 = 𝜇0 + 𝑡ν ,1−𝛼 . 𝐶. 𝑅. : 𝑋ത ≤ 𝑋ത𝐶 = 𝜇0 − 𝑡ν ,1−𝛼 .
𝑛 𝑛
o C. 𝑅. : 𝑡𝑜𝑏𝑠 ≥ 𝑡𝐶 = 𝑡ν ,1−𝛼 o 𝐶. 𝑅. : 𝑡𝑜𝑏𝑠 ≤ 𝑡𝐶 = −𝑡ν ,1−𝛼
𝑋ത − 𝜇0 𝑋ത − 𝜇0
𝑡𝑜𝑏𝑠 = 𝑡𝑜𝑏𝑠 =
𝑆ൗ 𝑆ൗ
𝑛 𝑛
No rechazo 𝐻0 No rechazo 𝐻0
Región crítica
Región crítica

1−𝛼 𝛼 𝛼 1−𝛼

𝜇0 𝑋ത𝐶 𝑋ത 𝑋ത𝐶 𝜇0 𝑋ത
0 𝑡𝐶 𝑡 𝑡𝐶 0 𝑡
24
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Ensayo bilateral
𝐻0 : 𝜇 = 𝜇0
𝐻𝑎 : 𝜇 ≠ 𝜇0
𝑆 𝑆
𝐶. 𝑅. : 𝑋ത ≤ 𝑋ത𝐶1 = 𝜇0 − 𝑡ν , 1− 𝛼 . 𝑜 𝑋ത ≥ 𝑋ത𝐶2 = 𝜇0 + 𝑡ν , 1− 𝛼 .
2 𝑛 2 𝑛
𝑆 𝑆
ó 𝐶. 𝑅. : 𝑡𝑜𝑏𝑠 ≤ 𝑡𝐶 = −𝑡ν , 1− 𝛼 . 𝑜 𝑡𝑜𝑏𝑠 ≥ 𝑡𝐶 = 𝑡ν , 1− 𝛼 .
2 𝑛 2 𝑛

No rechazo 𝐻0

Región crítica Región crítica


1−𝛼

𝑋ത𝐶1 𝜇0 𝑋ത𝐶2 𝑋ത
𝑡𝐶1 0 𝑡𝐶2 𝑡

25
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Nivel de significación a posteriori
Cuando utilicemos la distribución t de Student no vamos a poder calcular exactamente
el valor del 𝛼 ∗ . Solo tendremos una idea aproximada de los valores entre los que se
encuentra o si es menor a determinado valor. En todos los casos se debe buscar el valor
de la 𝑡𝑜𝑏𝑠 en la tabla.
Para el ensayo unilateral a cola derecha: Para el ensayo unilateral a cola izquierda:
𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 ≥ 𝜇0
𝐻𝑎 : 𝜇 > 𝜇0 𝐻𝑎 : 𝜇 < 𝜇0
𝛼 ∗ = 𝑃(𝑋ത ≥ 𝑋ത𝑚𝑢𝑒𝑠𝑡𝑟𝑎 \𝜇0 ) 𝛼 ∗ = 𝑃(𝑋ത ≤ 𝑋ത𝑚𝑢𝑒𝑠𝑡𝑟𝑎 \𝜇0 )
𝑋ത𝑚 − 𝜇0 𝑋ത𝑚 − 𝜇0
𝛼∗ = 1 − 𝐹𝑆𝑡 𝑡 = 𝛼∗= 𝐹𝑆𝑡 𝑡 =
𝑆ൗ 𝑆ൗ
𝑛 𝑛
Con ν grados de libertad. Con ν grados de libertad.
Para el ensayo bilateral, si 𝑋ത𝑚 < 𝜇0 : Para el ensayo bilateral, si 𝑋ത𝑚 > 𝜇0 :
𝛼∗ 𝛼∗
= 𝑃(𝑋ത ≤ 𝑋ത𝑚 \𝜇0 ) = 𝑃(𝑋ത ≥ 𝑋ത𝑚 \𝜇0 )
2 2

𝑋ത𝑚 − 𝜇0 ∗
𝑋ത𝑚 − 𝜇0
𝛼 = 2 . 𝐹𝑆𝑡 𝑡 = 𝛼 = 2 . 1 − 𝐹𝑆𝑡 𝑡 =
𝑆ൗ 𝑆ൗ
𝑛 𝑛
Con ν grados de libertad. Con ν grados de libertad.
26
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4
Por ejemplo, para 10 grados de libertad, si el 𝑡𝑜𝑏𝑠 nos diera 1,9, tenemos que ubicar
entre qué valores se encuentra, dentro de la tabla, y subir hasta el valor de 1 − 𝛼 y
calcular el complemento, que aquí hemos escrito en rojo. En este caso podremos decir
que 0,025 < 𝛼 ∗ < 0,05.
En cambio, si el 𝑡𝑜𝑏𝑠 nos diera 3,2, para los mismos grados de libertad, dicho valor es
mayor al máximo valor de la tabla. Por lo tanto, diremos que 𝛼 ∗ < 0,005.

𝑡𝑜𝑏𝑠 = 1,9 𝑡𝑜𝑏𝑠 =3,2

𝛼 0,20 0,10 0,05 0,025 0,01 0,005


u 0.800 0.900 0.950 0.975 0.990 0.995
1 1.3764 3.0777 6.3138 12.7062 31.8205 63.6567
2 1.0607 1.8856 2.9200 4.3027 6.9646 9.9248
3 0.9785 1.6377 2.3534 3.1824 4.5407 5.8409
4 0.9410 1.5332 2.1318 2.7764 3.7469 4.6041
5 0.9195 1.4759 2.0150 2.5706 3.3649 4.0321
6 0.9057 1.4398 1.9432 2.4469 3.1427 3.7074
7 0.8960 1.4149 1.8946 2.3646 2.9980 3.4995
8 0.8889 1.3968 1.8595 2.3060 2.8965 3.3554
9 0.8834 1.3830 1.8331 2.2622 2.8214 3.2498
ν=𝑛−1 10 0.8791 1.3722 1.8125 2.2281 2.7638 3.1693
11 0.8755 1.3634 1.7959 2.2010 2.7181 3.1058
12 0.8726 1.3562 1.7823 2.1788 2.6810 3.0545

27
11.77 - Estadística Aplicada I - Instituto Tecnológico de Buenos Aires – Unidad 4

También podría gustarte