Está en la página 1de 99

Tema 6.

Inferencia con muestras grandes

ESTADÍSTICA BÁSICA www.edbudep.com


1
Tema 6. Inferencia con muestras grandes

1. Intervalos de confianza para μ con muestras grandes


Z ~ N(0,1) 2. Determinación del tamaño muestral
3. Introducción al contraste de hipótesis
1- a
4. Contraste de hipótesis de la media μ con muestras grandes
5. Interpretación de un contraste usando el p-valor
a /2 a /2 6. Relación entre contrastes de hipótesis e intervalos de confianza
7. Inferencia sobre una proporción con muestras grandes
0
-4 -3 -2 -1 0 1 2 3 4
-z a/2 za/2

ESTADÍSTICA BÁSICA www.edbudep.com


2
1. Intervalos de confianza para μ con muestras grandes
Recordemos el problema de estimación…

¿ 𝜇?

• Queremos saber el valor de la estatura media poblacional, 𝜇.


• Tomo una muestra y calculo el estimador 𝑋.

• Utilizo 𝑋ത para asignar un valor aproximado a partir de los datos de una muestra.

ESTADÍSTICA BÁSICA www.edbudep.com


3
• Vamos a suponer el caso de dos
analistas diferentes.

• El primero toma una muestra muy


pequeña, de n=10

• El segundo toma una muestra muy


grande, de n=500

Estimación ‘puntual’
Analista 2

Analista 1

𝑥ҧ1 = 173
𝑥ҧ2 = 175
ESTADÍSTICA BÁSICA www.edbudep.com
4
• Vamos a suponer el caso de dos
analistas diferentes.

• El primero toma una muestra muy


• Si sólo decimos las estimaciones de cada unopequeña,
de estos dos
de analistas,
n=10
pareciera que ambas estimaciones son igual de buenas.


• El segundo toma una muestra muy
El valor numérico de la estimación no permite saber en qué medida es
más o menos precisa. grande, de n=500

1 1 𝑛
• ത =
Precisión 𝑋 = 𝜎2/𝑛 = 𝜎2

𝑉𝑎𝑟(𝑋)

• La estimación que se basa en más datos es más precisa

¿Cómo podemos incorporar esta informaciónAnalista


al estimar?
2

Analista 1

𝑥ҧ1 = 173
𝑥ҧ2 = 175
ESTADÍSTICA BÁSICA www.edbudep.com
5
1. Intervalos de confianza para μ con muestras grandes

• A partir de las estimaciones, vamos a construir unos intervalos, que llamaremos intervalos de confianza.

• Estos intervalos son un rango de valores entre los que, a partir de la muestra, se piensa puede estar el
valor del parámetro.

𝑛1 = 10
𝑠Ƹ1 = 5 𝑛2 = 500
𝑥ҧ1 = 173 𝑠Ƹ2 = 4.7
𝑥ҧ2 = 175

𝜇 ∈ 𝜇Ƹ inferior ; 𝜇Ƹ superior

ESTADÍSTICA BÁSICA www.edbudep.com


6
1. Intervalos de confianza para μ con muestras grandes
• A partir de las estimaciones, aprenderemos a construir unos intervalos, que llamaremos intervalos de confianza

• Estos intervalos son un rango de valores entre los que, a partir de la muestra, se piensa puede estar el valor del
parámetro
Intervalo del analista 1
• Después de tomar la muestra, seguimos sin
saber exactamente el valor de 𝜇 pues , en
general, 𝑥ҧ ≠ 𝜇.
𝑛1 = 10
𝑠Ƹ1 = 5 • Pero con la información
𝑛 = 500de la muestra
𝑥ҧ1 = 173 podemos decir con𝑠Ƹ1“mucha
= 4.7 confianza” que
la media poblacional es175
𝑥ҧ1 = un número que
está entre 170 y 176.

• Nuestra incertidumbre sobre el valor de 𝜇


es de un intervalo de amplitud 6. Tenemos
𝜇 ∈ (170; 176) un margen de error de 3.

Intervalo de confianza
170 3 173 3
176 Estimación por intervalos
ESTADÍSTICA BÁSICA www.edbudep.com
7
1. Intervalos de confianza para μ con muestras grandes
• A partir de las estimaciones, vamos a construir unos intervalos, que llamaremos intervalos de confianza
• Estos intervalos son un rango de valores entre los que, a partir de la muestra, se piensa puede estar el
valor del parámetro
Intervalo del analista 2

• Después de tomar la muestra, seguimos sin


saber exactamente el valor de 𝜇 pues, en 𝑛2 = 500
general, 𝑥ҧ ≠ 𝜇 𝑠Ƹ2 = 4.7
𝑥ҧ2 = 175
• Pero con la información de la muestra
podemos decir con “mucha confianza” que
la media poblacional es un número que está
entre 174.6 y 175.4
• Nuestra incertidumbre sobre el valor de 𝝁 es
de un intervalo𝜇de amplitud
∈ (170; 176) 0.8. El margen de 𝜇 ∈ (174.6; 175.4)
error es de sólo 0.4 !!!
0.4 0.4
Intervalo de confianza
170 174.6 175.4
Estimación por173
intervalos176
175
ESTADÍSTICA BÁSICA www.edbudep.com
8
1. Intervalos de confianza para μ con muestras grandes
• A partir de las estimaciones, vamos a construir unos intervalos, que llamaremos intervalos de confianza
• Estos intervalos son un rango de valores entre los que, a partir de la muestra, se piensa puede estar el
valor del parámetro

𝑛2 = 500
𝑛1 = 10 • La estimación con más datos tiene más 𝑠Ƹ2 = 4.7
𝑠Ƹ1 = 5 información de la población. 𝑥ҧ2 = 175
• Reduce más nuestra incertidumbre sobre
𝑥ҧ1 = 173
el valor del parámetro.
• Y por eso, el intervalo es más estrecho.

𝜇 ∈ (170; 176) 𝜇 ∈ (174.6; 175.4)


3 0.4
173±3 175±0.4
170 173 176 174.6 175.4
175
ESTADÍSTICA BÁSICA www.edbudep.com
9
1. Intervalos de confianza para μ con muestras grandes
Vamos a aprender a construir intervalos de confianza para la media poblacional 𝜇 basado en una muestra grande
• Sea 𝑋 una v. aleatoria de interés con distribución cualquiera y
con
𝐸 𝑋 =𝜇 Var 𝑋 = 𝜎 2

𝑋
• Estimaremos 𝜇 con 𝑋ത

• El estimador 𝑋ത es una variable aleatoria

𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑋ത =
𝑛

¿Cuál es su distribución muestral?


Vamos a ver las dos situaciones en las que se cumple que 𝑋ത
es NORMAL, y basaremos la inferencia en la normalidad de 𝑋ത

ESTADÍSTICA BÁSICA www.edbudep.com


10
Recordatorio Tema 5…

𝜎2
𝑋ത ∼ 𝑁 𝜇 ;
𝑛

ESTADÍSTICA BÁSICA www.edbudep.com


11
Vamos a recordar las dos situaciones en las que se cumple que 𝑋ത es NORMAL, y basaremos la inferencia en la normalidad de 𝑋ത

𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑋ത =
𝑛

• Si la población es normal 𝑋 ∼ 𝑁(𝜇; 𝜎 2 ) • Si la muestra es grande 𝑛 > 30 , por


• Para cualquier tamaño muestral el Teorema Central del Límite (Tema 5)
• Para cualquier población 𝑋

𝜎2
𝑋ത ∼ 𝑁 𝜇 ;
𝑛

𝑋ത − 𝜇
𝑍=𝜎
ൗ 𝑛

𝐸 𝑋ത = 𝜇
ESTADÍSTICA BÁSICA www.edbudep.com
12
En la distribución Z vamos a separar un área 𝛼Τ2 a cada lado. Esta separación la vamos a usar en muchas de
las explicaciones, por lo que debemos entender la notación que vamos a usar.

Z ~ N(0,1)
𝑋ത − 𝜇
𝑍=𝜎
ൗ 𝑛
1−𝛼
𝛼ൗ 𝛼ൗ
2 2

0
-4 -3 -2 -1 0 1 2 3 4

−𝑧𝛼Τ2 𝑧𝛼Τ2
𝑧1−𝛼Τ2

𝑧área que queda a la derecha = 𝑧𝛼Τ2

ESTADÍSTICA BÁSICA www.edbudep.com


13
La usaremos muy frecuentemente con 𝛼 = 0.05 y 𝛼 = 0.10
Z ~ N(0,1)
𝜶 = 𝟎. 𝟎𝟓

𝛼
2
= 0.025 0.95 𝛼
= 0.025
2

-4 -3 -2 -1 0 1 2 3 4

−𝑧0.025 = −1.96 𝑧0.025 = 1.96

𝜶 = 𝟎. 𝟏𝟎

𝛼 0.90 𝛼
= 0.05 = 0.05
2 2
-4 -3 -2 -1 0 1 2 3 4

−𝑧0.05 = −1.645 𝑧0.05 = 1.645


ESTADÍSTICA BÁSICA www.edbudep.com
14
𝑋ത − 𝜇
𝑍=𝜎 ∼ 𝑁(0,1) 𝑃 −𝑧𝛼Τ2 < 𝑍 < 𝑧𝛼Τ2 = 1 − 𝛼
La variable aleatoria es
ൗ 𝑛
ത y el experimento
𝑋,
aleatorio consiste en
calcular 𝑋ത en cada
muestra y hallar Z. 𝑋ത − 𝜇
𝑃 −𝑧𝛼Τ2 < 𝜎 < 𝑧𝛼Τ2 = 1 − 𝛼 Esta probabilidad es sobre la proporción de
ൗ 𝑛 veces que se observa el suceso que está entre
paréntesis al cambiar la muestra.

𝜇 estará entre esos dos valores


𝜎 𝜎
con probabilidad 1 − 𝛼
𝑃 𝑋ത − 𝑧𝛼Τ2 < 𝜇 < 𝑋ത + 𝑧𝛼Τ2 = 1−𝛼
𝑛 𝑛
𝜇 estará entre esos dos valores el
(1 − 𝛼) % de las muestras

𝜎 𝜎
𝜇 ∈ 𝑋ത − 𝑧𝛼Τ2 ത
; 𝑋 + 𝑧𝛼Τ2
𝑛 𝑛
Al cambiar la muestra, cambian los límites del
intervalo.
𝜇 ∈ 𝜇Ƹ inferior ; 𝜇Ƹ superior El 1 − 𝛼 100% de los intervalos contiene a 𝜇

Este intervalo se denomina


Intervalo de confianza
ESTADÍSTICA BÁSICA www.edbudep.com
15
𝜎 𝜎
𝑃 𝑋ത − 𝑧𝛼Τ2 ത
< 𝜇 < 𝑋 + 𝑧𝛼Τ2 = 1−𝛼
𝑛 𝑛

Intervalo de confianza de nivel de confianza (𝟏 − 𝜶) para μ

𝜎
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2
𝑛

Los más utilizados son los del 95% y del 90%…


𝜎 𝜎
𝐼𝐶 0.95 : 𝜇 ∈ 𝑋ത ± 1.96 𝐼𝐶 0.90 : 𝜇 ∈ 𝑋ത ± 1.645
𝑛 𝑛

Vamos a ver qué significa el nivel de confianza de un intervalo


ESTADÍSTICA BÁSICA www.edbudep.com
16
Usaremos, como ejemplo, que 𝜎 𝜎
𝛼 = 5% ⇒ 𝑧0.05 = 1.96 𝑃 𝑋ത − 1.96 ത
< 𝜇 < 𝑋 + 1.96 = 0.95
𝑛 𝑛

Si tomásemos diferentes muestras de tamaño 𝑛, y con cada estimación 𝑋ത que se


obtenga calculamos el intervalo
𝜎 𝜎
𝑋ത − 1.96 ; 𝑋ത + 1.96
𝑛 𝑛
Entonces, el 95% de esos intervalos tendría el valor de m

m
muestra 1
• Nosotros sólo tendremos una muestra, y un intervalo.
x1
muestra 2 • No sabemos si nuestro intervalo es de los que
x2
contiene o no a 𝜇.
muestra 3
x3 • Como el 95% de las muestras sí lo contiene, decimos
muestra 4 que tenemos una confianza del 95% en que nuestra
x4
muestra 5
muestra sí lo contenga.
x5 • Decimos entonces que nuestro intervalo tiene una
muestra 6 confianza del 95%.
x6
muestra 7
x7

ESTADÍSTICA BÁSICA www.edbudep.com


17
Ejemplo Con muestra aleatoria extraída de una población con 𝜎² = 100 de n=144 observaciones se
tiene una media muestral 𝑥ҧ = 160. se pide:
(a) Calcular un intervalo de confianza del 95% para μ.
(b) Calcular un intervalo de confianza del 90% para μ.

𝜎 = 10
(a)
𝜎
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2
𝑛

𝑛 = 144
1 − 𝛼 = 0.95 = 95% 𝑥ҧ = 160

𝛼Τ2 = 0.05Τ2 = 0.025

¿ 𝑧0.025 ?

ESTADÍSTICA BÁSICA www.edbudep.com


18
Ejemplo Con muestra aleatoria extraída de una población con 𝜎² = 100 de n=144 observaciones se
tiene una media muestral 𝑥ҧ = 160. se pide:
(a) Calcular un intervalo de confianza del 95% para μ.
(b) Calcular un intervalo de confianza del 90% para μ.

(a) 𝜎 10
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2 = 160 ± 1.96
𝑛 12
= 160 ± 1.6 = 158.4 ; 161.6

𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 158.4 ; 161.6

Antes de tomar la muestra no sabíamos qué valor tomaba la media poblacional, nuestra incertidumbre era
‘total’. Después de analizar la muestra, nuestra incertidumbre ha disminuido, y tenemos una confianza del 95%
de que la media es un número comprendido entre 158.4 y 161.6. El intervalo tiene una amplitud de 3.2.

Diferentes muestras de n=144 de esta población darán diferentes intervalos de nivel 95%, al tener
ത El 95% de los intervalos contendrá a la media poblacional. Tenemos un 95% de
diferente 𝑋.
confianza de que nuestro intervalo sea uno de ellos y contenga a 𝜇.
ESTADÍSTICA BÁSICA www.edbudep.com
19
Ejemplo Con muestra aleatoria extraída de una población con 𝜎² = 100 de n=144 observaciones se
tiene una media muestral 𝑥ҧ = 160. se pide:
(a) Calcular un intervalo de confianza del 95% para μ.
(b) Calcular un intervalo de confianza del 90% para μ.

(b) 𝜎 10
𝐼𝐶 0.90 : 𝜇 ∈ 𝑋ത ± 𝑧0.05 = 160 ± 𝑧0.05
𝑛 12
10
= 160 ± 1.645 = 160 ± 1.37 = (158.6 ; 161.4)
12
El intervalo es más estrecho que antes. Su amplitud es de 2.74 y el del 95% era de 3.2.

Si con la misma información (los mismos datos) vamos a tener menos confianza en que el intervalo va a tener al
parámetro, es porque va a ser más estrecho que antes. Es más fácil que el parámetro esté fuera.

En este caso, un intervalo más estrecho no es porque tengamos menos incertidumbre, sino porque lo queremos
de menos confianza. La incertidumbre es la misma porque la información que tenemos es la misma.

ESTADÍSTICA BÁSICA www.edbudep.com


20
Ejemplo Con muestra aleatoria extraída de una población con 𝜎² = 100 de n=144 observaciones se
tiene una media muestral 𝑥ҧ = 160. se pide: 𝜎

𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋 ± 𝑧𝛼Τ2
Con (a) Calcular un intervalo de confianza del 95% para μ. 𝑛
Minitab

1
4
5

Desviación
estándar
conocida= 𝜎 2

ESTADÍSTICA BÁSICA www.edbudep.com


21
Ejemplo Con muestra aleatoria extraída de una población con 𝜎² = 100 de n=144 observaciones se
tiene una media muestral 𝑥ҧ = 160. se pide:
(a) Calcular un intervalo de confianza del 95% para μ.
(b) Calcular un intervalo de confianza del 90% para μ.

• El interés está en conseguir intervalos estrechos pero con un nivel


(b) de confianza alto. 𝜎 10
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2 = 160 ± 𝑧0.05
𝑛 12
• De nada sirve estrechar
10 un intervalo si perdemos confianza en que
tenga al parámetro
= 160 ± 1.645 verdadero.
= 160 ± 1.37 = (158.6 ; 161.4)
12
Lo habitual
• intervalo
El es más en la práctica
estrecho esSuutilizar
que antes. amplitudun nivel
es de 2.74de
y el confianza del
del 95% era de 3.295%,
que implica 𝛼 = 0.05.
Si con la misma información (los mismos datos) vamos a tener menos confianza en que el intervalo va
a tener al parámetro, es porque va a ser más estrecho que antes.
• En la práctica construiremos generalmente intervalos del 95% los
más
En este caso, unestrechos
intervalo másposible.
estrecho no es porque tengamos menos incertidumbre, sino porque lo
queremos de menos confianza. La incertidumbre es la misma porque la información que tenemos es
la misma
ESTADÍSTICA BÁSICA www.edbudep.com
22
intervalo de confianza de nivel de confianza 100 × (1 − 𝛼)% para μ

𝜎
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2
𝑛
𝐿

𝝈
Margen de error 𝑳= 𝒛𝜶/𝟐
𝒏

Amplitud o ancho del intervalo: 𝟐 × 𝑳

• Dado un nivel de confianza, a mayor margen de error mayor es la incertidumbre que tenemos
sobre el verdadero valor de la media.

• Puesto que la desviación típica de la población 𝜎 no la podremos disminuir, lo único que


podremos hacer para reducir la incertidumbre sobre 𝜇 es aumentar el tamaño muestral.
ESTADÍSTICA BÁSICA www.edbudep.com
23
intervalo de confianza de nivel de confianza 100 × (1 − 𝛼)% para μ

𝜎
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2
𝑛
𝐿

𝝈
Margen de error 𝑳= 𝒛𝜶/𝟐
𝒏
Amplitud o ancho del intervalo: 𝟐 × 𝑳

• Dado un nivel de confianza, a mayor margen de error (o amplitud del intervalo) mayor
es la incertidumbre que tenemos sobre el verdadero valor de la media.

• Puesto que la desviación típica de la población 𝜎 no la podremos disminuir, lo único


que podremos hacer para reducir la incertidumbre sobre 𝜇 es aumentar el tamaño
muestral.
ESTADÍSTICA BÁSICA www.edbudep.com
24
𝜎
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2
𝑛 Es también un parámetro, y
será desconocido
Lo sustituimos por un
estimador

𝜎ො
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2
𝑛

¿Qué estimador usamos para 𝜎²?

ESTADÍSTICA BÁSICA www.edbudep.com


25
¿Qué estimador usamos para σ² ?
𝑛 ത 2
σ 𝑖=1 𝑋𝑖 − 𝑋
Método de los momentos: varianza 𝑆2 =
muestral 𝑛

Se puede demostrar que es


SESGADO

subestima la verdadera varianza

Por eso se utiliza la cuasivarianza, σ 𝑛


𝑋 − ത
𝑋 2
𝑖=1 𝑖
que se puede demostrar que es 𝑆መ 2 =
INSESGADO 𝑛−1

ESTADÍSTICA BÁSICA www.edbudep.com


26
intervalo de confianza de nivel de confianza 100×(1-α)% para μ

𝑆መ
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2
𝑛

• El sustituir el parámetro 𝜎, que es un número, por el estimador 𝑆,


መ que es una variable aleatoria,
afecta a las propiedades estadísticas del intervalo.

• Pero si la muestra es grande, esa influencia no es relevante.

• Por tanto, estos intervalos de confianza que usan 𝑆መ sólo son válidos si la muestra es grande
(intervalos asintóticos).

• Si la muestra fuese pequeña, es posible que no tengan el nivel de confianza que estamos pensando.

ESTADÍSTICA BÁSICA www.edbudep.com


27
intervalo de confianza de nivel de confianza 100×(1-α)% para μ

𝑆መ
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2
𝑛

Ejemplo Se mide la duración de 200 componentes electrónicos hasta su avería. De esos 200 datos se tiene
que la media muestral es 1300 horas y la cuasivarianza es 10.000 (horas al cuadrado). Calcula un
intervalo de confianza de μ de nivel de confianza 95%

X = 1300
Sˆ 2 = 10.000 10000
n = 200 𝜇 ∈ 1300 ± 1.96 𝜇 ∈ [1286; 1314]
200
a = 0.05
z0.025 = 1.96

ESTADÍSTICA BÁSICA www.edbudep.com


28
Ejemplo Se mide la duración de 200 componentes electrónicos hasta su avería. De esos 200 datos se tiene
que la media muestral es 1300 horas y la cuasivarianza es 10.000 (horas al cuadrado). Calcula un
intervalo de confianza de μ de nivel de confianza 95%

𝑆መ
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2
𝑛

4
Desviación
5
estándar
conocida= 𝜎
Como no la
tenemos
pero la
muestra es 2
grande,
usamos 𝑠Ƹ

ESTADÍSTICA BÁSICA www.edbudep.com


29
Tema 6. Inferencia con muestras grandes

1. Intervalos de confianza para μ con muestras grandes


Z ~ N(0,1) 2. Determinación del tamaño muestral
3. Introducción al contraste de hipótesis
1- a
4. Contraste de hipótesis de la media μ con muestras grandes
5. Interpretación de un contraste usando el p-valor
a /2 a /2 6. Relación entre contrastes de hipótesis e intervalos de confianza
7. Inferencia sobre una proporción con muestras grandes
0
-4 -3 -2 -1 0 1 2 3 4
-z a/2 za/2

ESTADÍSTICA BÁSICA www.edbudep.com


30
2. Determinación del tamaño muestral
Acabamos de ver que...
intervalo de confianza de nivel de confianza 1 − 𝛼 × 100% para 𝜇

𝑆መ
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2
𝑛

𝐿=Margen de error
𝜇 ∈ (𝑋ത ± 𝐿) 2 × 𝐿=amplitud o ancho del intervalo

¿Cuál debe ser 𝑛 para conseguir un margen de error 𝐿 determinado?

Lo estimo con alguna


muestra piloto

𝜎 𝑧𝛼Τ2 𝜎 2
𝐿 = 𝑧𝛼Τ2 ⇒𝑛=
𝑛 𝐿
Función techo 4.01 = 5
ESTADÍSTICA BÁSICA www.edbudep.com
31
Ejemplo Sea 𝑋 el contenido de impurezas de azufre en un material metálico (tipo de acero)
obtenido en cierto proceso siderúrgico (miligramos de impureza por kilogramo de
producto obtenido). Se toma una muestra aleatoria de 200 observaciones obteniéndose
una media muestral de 120 mg/Kg y una desviación típica muestral 20 mg/Kg.

X = 120
Sˆ = 20
n0 = 200

a) Estimar mediante un intervalo de un 95% de confianza el contenido medio de azufre.

b) ¿Qué tamaño muestral sería necesario para que el margen de error sea L=1 mg con un 95% de confianza?

ෝ 2
𝑧𝛼Τ2 𝜎 (1.96)(20) 2
𝑛= = = 1536.6 = 1537 observaciones
𝐿 1

ESTADÍSTICA BÁSICA www.edbudep.com


32
Sea 𝑋 el contenido de impurezas en un material obtenido en cierto proceso productivo (miligramos de
Ejemplo
impureza por kilogramo de producto obtenido). Se toma una muestra aleatoria de 200 observaciones
obteniéndose una media muestral del consumo de 120 mg/Kg y una desviación típica muestral 20 mg/Kg.
¿Qué tamaño muestral sería necesario para que el margen de error sea L=1 mg con un 95% de confianza?

𝑧0.025 𝜎 2
2
𝑛=
𝐿

1
4

5
6

Realmente no conocemos 𝜎, pero queremos que use la fórmula que hemos visto, que
asume 𝜎 conocida. Es válida si la muestra es grande, pues entonces 𝑠Ƹ ≈ 𝜎
ESTADÍSTICA BÁSICA www.edbudep.com
33
Problema El archivo TiempoTareas.mtw tiene tiempos de ejecución (minutos) de diferentes tareas.

a. Construye un intervalo de confianza del 90% de la media poblacional que corresponde con la muestra
Tiempo6.
b. ¿Cuántas tareas debemos cronometrar para estimar la duración media con un margen de error de medio
minuto, con una confianza del 90%?

Hazlo con Minitab, pero utilizando las fórmulas vistas en el Tema 6 (muestras grandes con sigma conocida)

Las fórmulas vistas en el Tema 6 para el IC de la media se basa en


𝜎2
𝑋ത ∼ 𝑁 𝜇; con 𝜎 conocida.
𝑛
Si no se conoce, y se tiene una muestra grande, se sigue usando esa misma
fórmula reemplazando 𝜎 por 𝑠.Ƹ

𝜎 𝑆መ
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2 𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2
𝑛 𝑛

𝜎 𝑧𝛼Τ2 𝜎 2
𝐿 = 𝑧𝛼Τ2 ⇒𝑛=
𝑛 𝐿

ESTADÍSTICA BÁSICA www.edbudep.com


34
Tema 6. Inferencia con muestras grandes

1. Intervalos de confianza para μ con muestras grandes


Z ~ N(0,1) 2. Determinación del tamaño muestral
3. Introducción al contraste de hipótesis
1- a
4. Contraste de hipótesis de la media μ con muestras grandes
5. Interpretación de un contraste usando el p-valor
a /2 a /2 6. Relación entre contrastes de hipótesis e intervalos de confianza
7. Inferencia sobre una proporción con muestras grandes
0
-4 -3 -2 -1 0 1 2 3 4
-z a/2 za/2

ESTADÍSTICA BÁSICA www.edbudep.com


35
? Hay dos tipos de inferencia.
(principalmente)

Inferencia
Dos razones distintas por las
estadística que queremos conocer
cómo es la población a
partir de una muestra.
?

ESTADÍSTICA BÁSICA www.edbudep.com


36
¿ 𝜆? ¿ 𝜇? ¿𝜎 ? 2
¿ 𝑄3 ?
¿ 𝑃(𝑋 < 20)?

Estimación
Puntual o por intervalos

El primer tipo de inferencia responde a la


pregunta:
Métodos de estimación y
construcción de intervalos ¿Cómo es la población?
Inferencia: Estimación de sus parámetros

𝑥,ҧ 𝑠,Ƹ 𝑛, … MUESTRA

ESTADÍSTICA BÁSICA www.edbudep.com


37
Tema 5

Puntual

Estimación
Tema 6

Intervalos

Inferencia
estadística

ESTADÍSTICA BÁSICA www.edbudep.com


38
¿ 𝑄3 = 20?
¿ 𝜆 > 6? ¿ 𝜇 = 4?
𝑋 ∼ Weibull
𝑋 ∼Normal ¿ 𝜎 2 < 10?
¿ 𝑃 𝑋 < 20 = 0.7?
Contraste de hipótesis
Parámetros o de modelos En el segundo tipo de inferencia se responde a
la pregunta:

¿La población es o no es de una


Métodos de elaboración de determinada manera?
contrastes de hipótesis
¿La población cumple o no cumple una
determinada HIPÓTESIS

Inferencia: Contraste de hipótesis


𝑥,ҧ 𝑠,Ƹ 𝑛, … MUESTRA

ESTADÍSTICA BÁSICA www.edbudep.com


39
Tema 5

Puntual

Estimación
Tema 6

Intervalos

Inferencia
estadística
Temas 6,7,8

Parámetros

Contraste de
hipótesis
Tema 10

Modelos

ESTADÍSTICA BÁSICA www.edbudep.com


40
Un fabricante de transistores del tipo BC547B sabe que cuando su producción se mantiene en
Ejemplo los niveles de calidad deseables, el valor de la llamada ganancia en corriente de los
transistores (conocida por 𝜷, adimensional) sigue una distribución normal de media 290 y
varianza 760.

𝑋 =Ganancia en corriente de un transistor BC547B.


𝑋 ∼ 𝑁(290; 760)
Son en realidad estimaciones con muchísimos datos
históricos tal que el margen de error es ya despreciable. A
efectos prácticos, los consideramos como si fuesen los
𝛽 poblacionales
𝜇 = 290
𝜎 2 = 760
𝜎 = 760

𝜇 = 290

ESTADÍSTICA BÁSICA www.edbudep.com


41
3. Ejemplo
IntroducciónUn
al fabricante
contraste de hipótesis
de transistores del tipo BC547B sabe que cuando su producción se mantiene en
los niveles de calidad deseables, el valor de la llamada ganancia en corriente de los
transistores (conocida por 𝜷, adimensional) sigue una distribución normal de media 290 y
varianza 760.
• Yo ya tengo el conocimiento de la
𝛽 población en el supuesto de que se
𝜇 = 290 mantiene en las condiciones deseables.
2
𝜎 = 760
• ¿Cómo puedo saber si el proceso se
𝜎 = 760

mantiene en esas mismas condiciones?

• ¿Es la población de ahora la misma que


antes?
𝜇 = 290

¿Se mantiene la producción en los niveles de calidad deseables?


¿Es la población de ahora igual de buena que la de antes?

ESTADÍSTICA BÁSICA www.edbudep.com


42
3. Introducción al contraste de hipótesis
Ejemplo
¿Es la población de ahora igual de buena que
la de antes?
𝛽 𝜇 = 290
𝜎 2 = 760
Desconozco la población de ahora

Quiero saber si sus parámetros han


empeorado
𝜇 = 290

¿Se mantiene la media? ¿Ha aumentado la variabilidad?

Los transistores se venderán con Idealmente, todos los transistores


la información de que 𝛽 = 290. deben ser iguales, con 𝛽 = 290. Sin
Por tanto, la media no de embargo, hay variabilidad. Ésta no
aumentar ni disminuir. Debe debe empeorar, es decir. La varianza
mantenerse en 𝜇 = 290 deberá ser 𝜎 2 ≤ 760.
Debo detectar, por tanto, si 𝜎 2 > 760

ESTADÍSTICA BÁSICA www.edbudep.com


43
3. Introducción al contraste de hipótesis
Ejemplo
¿Es la población de ahora igual de buena que
la de antes?
𝜇 = 290
𝛽 𝜎 2 = 760
Desconozco la población de ahora

Quiero saber si sus parámetros han


empeorado
𝜇 = 290

¿Se mantiene la media? ¿Ha aumentado la variabilidad?

SÍ NO SÍ NO

𝜇 = 290 𝜇 ≠ 290 𝜎 2 > 760 𝜎 2 ≤ 760

Las hipótesis que se plantean son sobre los parámetros de la


población. Son restricciones sobre sus valores posibles
ESTADÍSTICA BÁSICA www.edbudep.com
44
Ejemplo
¿Se mantiene la media? ¿Ha aumentado la variabilidad?

𝜇 = 290
𝛽 𝜎 2 = 760 SÍ NO SÍ NO
𝜇 = 290 𝜇 ≠ 290 𝜎 2 > 760 𝜎 2 ≤ 760
𝜇 = 290

Para plantear las hipótesis del contraste hacemos una pregunta sobre la población,
que tenga dos respuestas: SI o NO.

• Una de ellas será lo que se denomina HIPÓTESIS NULA, 𝐻0


• La otra será la HIPÓTESIS ALTERNATIVA, 𝐻1

La hipótesis nula será la que tenga el signo = (=, ≥, ≤)

ESTADÍSTICA BÁSICA www.edbudep.com


45
Ejemplo
¿Se mantiene la media? ¿Ha aumentado la variabilidad?

𝜇 = 290
𝛽 𝜎 2 = 760
SÍ NO SÍ NO
𝜇 = 290 𝜇 ≠ 290 𝜎 2 ≤ 760
𝜎 2 > 760
𝜇 = 290 𝐻0 𝐻1 𝐻1 𝐻0

Hipótesis nula Hipótesis alternativa


𝐻0 𝐻1
¿Se mantiene la
media? 𝜇 = 290 vs 𝜇 ≠ 290 alternativa bilateral

¿Ha aumentado la 𝜎 2 ≤ 760 vs alternativa unilateral


variabilidad?
𝜎 2 > 760

• Entre 𝐻0 y 𝐻1 está todo el rango de valores posibles del parámetro.


• 𝐻0 debe tener siempre el signo =

• Se aceptará 𝐻0 salvo que haya mucha evidencia en contra.


• La 𝐻0 es como un acusado en un juicio, que es inocente salvo que haya evidencia clara en contra.

ESTADÍSTICA BÁSICA www.edbudep.com


46
¿Se mantiene la media? ¿Ha aumentado la variabilidad?

SÍ NO SÍ NO

𝜇 = 290 𝜇 ≠ 290 𝜎 2 > 760 𝜎 2 ≤ 760

Son hipótesis que quiero contrastar con los datos

¿En qué se basa?

• Tomo una muestra de observaciones


• A la vista de los datos decido si Acepto o Rechazo la hipótesis (el objetivo no es estimar sino validar)

Por ejemplo:

Si 𝑥lj >> 290 parece muy probable que la media NO se mantiene

Si 𝑥lj ≃ 290 parece muy probable que la media SI se mantiene

ESTADÍSTICA BÁSICA www.edbudep.com


47
Por ejemplo, supongamos que queremos valorar si una moneda está equilibrada (sale cara con
probabilidad 𝑝 = 0.5), o no lo está (sale cara con probabilidad 𝑝 ≠ 0.5

¿La moneda está equilibrada?

SÍ NO
𝑝 = 0.5 𝑝 ≠ 0.5

Lanzo la moneda 10 veces 7


𝑝Ƹ = = 0.7 ≠ 0.5
y salen 7 caras y 3 sellos 10

¿Es evidencia suficiente para concluir que la moneda


no está equilibrada y entonces 𝑝 ≠ 0.5?

¿O ese resultado es fácil obtenerlo ‘por casualidad’ y


todavía se puede concluir que 𝑝 = 0.5?

ESTADÍSTICA BÁSICA www.edbudep.com


48
En el ejemplo de la moneda equilibrada:
Lanzo la moneda 10 veces
¿La moneda está equilibrada? y salen 7 caras y 3 sellos

SÍ NO
7
𝑝 = 0.5 𝑝 ≠ 0.5 𝑝Ƹ = = 0.7 ≠ 0.5
10
𝐻0 𝐻1

• La probabilidad de sacar más de 6 caras al lanzar una moneda equilibrada 10 veces es del 17% (si 𝐻0 es cierta, el nº
de caras es binomial B(10;0.5), y en ese modelo 𝑃(𝑋 > 6 = 0.17).

• Por tanto, lo que hemos observado NO ES TAN RARO como para concluir que la moneda esté desequilibrada.

• La diferencia que se ha encontrado entre 𝑝Ƹ y 𝑝 se pueden explicar por el azar. No es significativa.

• No hay, por tanto, evidencia suficiente para rechazar 𝐻0 .

• Sólo se rechaza 𝐻0 si 𝑝Ƹ tuviese una probabilidad de ser vista, en una moneda equilibrada, mucho menor, por
ejemplo menos del 5%.

ESTADÍSTICA BÁSICA www.edbudep.com


49
Tema 6. Inferencia con muestras grandes

1. Intervalos de confianza para μ con muestras grandes


Z ~ N(0,1) 2. Determinación del tamaño muestral
3. Introducción al contraste de hipótesis
1- a
4. Contraste de hipótesis de la media μ con muestras grandes
5. Interpretación de un contraste usando el p-valor
a /2 a /2 6. Relación entre contrastes de hipótesis e intervalos de confianza
7. Inferencia sobre una proporción con muestras grandes
0
-4 -3 -2 -1 0 1 2 3 4
-z a/2 za/2

ESTADÍSTICA BÁSICA www.edbudep.com


50
4. Contraste de hipótesis de la media μ

Para contrastar una hipótesis sobre la media 𝜇 seguimos los siguientes pasos:

PASO 1: Especificamos la hipótesis nula y la alternativa. Queremos contrastar alguna de estas hipótesis, donde 𝜇0 es
un valor concreto

𝐻0 : 𝜇 = 𝜇0 𝐻0 : 𝜇 ≤ 𝜇0 𝐻0 : 𝜇 ≥ 𝜇0
𝐻1 : 𝜇 ≠ 𝜇0 𝐻1 : 𝜇 > 𝜇0 𝐻1 : 𝜇 < 𝜇0

En el ejemplo de los transistores. Se desea saber si la población de transistores del proceso


Ejemplo
productivo mantiene la media en μ0 =290

H0 H1

𝜇 = 290 𝜇 = 290 𝜇 ≠ 290


𝛽 𝜎 2 = 760

𝜇 = 290

ESTADÍSTICA BÁSICA www.edbudep.com


51
PASO 2: Hallamos una medida de la discrepancia entre los datos y 𝐻0

Sólo si esa discrepacia es grande rechazaremos 𝑯𝟎


Esa medida de discrepancia se denomina estadístico de contraste

¿Cómo se busca el estadístico de Usando las propiedades del estimador del parámetro.
contraste, que resuma la información Utilizando su distribución muestral, e introduciendo la
relevante para un contraste? información de H0

Sabemos que, para muestras grandes

Estadístico de contraste Mide la distancia


entre 𝑋ത y 𝜇0
El estadístico 𝑍 también vale
para muestras pequeñas si la
población es normal

ESTADÍSTICA BÁSICA www.edbudep.com


52
Ejemplo En el ejemplo de los transistores. Se desea saber si la población de transistores del proceso
productivo mantiene la media en μ0 =290

H0 H1
𝜇 = 290
𝛽 𝜎 2 = 760
𝜇 = 290 𝜇 ≠ 290

𝜇 = 290

Con datos sobre la


ganancia en corriente de
n=100 transistores:

Resume en un número la información para


decidir entre H0 y H1

Necesitamos una referencia que nos diga si ese


valor implica una distancia muy grande entre los
datos y 𝐻0

ESTADÍSTICA BÁSICA www.edbudep.com


53
Para valorar el estadístico de contraste, buscamos una distribución de referencia que nos diga si es un valor grande o
PASO 3: pequeño. Es la distribución muestral del estadístico de contraste cuando se cumple el signo = en 𝐻0

La distribución de referencia es la del estadístico de


contraste cuando 𝜇 = 𝜇0.
N(0,1)
Si la muestra es grande (𝒏 > 𝟑𝟎)

N(0,1)

0
ESTADÍSTICA BÁSICA www.edbudep.com
54
PASO 4: Localizamos en qué zonas de la distribución de referencia rechazaremos H0.
Rechazamos H0 si los datos hacen lo que dice H1 de forma muy evidente.

PASO 1: PASO 2: PASO 3:


Caso (a)
𝑋ሜ − 290
𝐻0 : 𝜇 = 290; 𝐻1 : 𝜇 ≠ 290 𝑇0 = 𝑇0~𝑁(0,1)
መ 𝑛
𝑆/

Rechazamos H0 si

𝑥lj << 290 𝑥lj >> 290

𝑥lj − 290 𝑥lj − 290
𝑡0 = << 0 𝑡0 = >> 0
𝑠/
Ƹ 𝑛 𝑠/
Ƹ 𝑛
N(0,1)

Si H0 es falsa Si H0 es falsa
tenderemos a estar por tenderemos a estar por
esta zona esta zona

0
ESTADÍSTICA BÁSICA www.edbudep.com
55
PASO 4: Localizamos en qué zonas de la distribución de referencia rechazaremos H0.
Rechazamos H0 si los datos hacen lo que dice H1 de forma muy evidente.

PASO 2: PASO 3:
Caso (b) PASO 1:
𝑋ሜ − 290
𝐻0 : 𝜇 ≤ 290; 𝐻1 : 𝜇 > 290 𝑇0 = 𝑇0~𝑁(0,1)
መ 𝑛
𝑆/

Rechazamos H0 si

𝑥lj >> 290

𝑥lj − 290
𝑡0 = >> 0
𝑠/
Ƹ 𝑛

N(0,1) Si H0 es falsa
tenderemos a estar por
esta zona

0
ESTADÍSTICA BÁSICA www.edbudep.com
56
PASO 4: Localizamos en qué zonas de la distribución de referencia rechazaremos H0.
Rechazamos H0 si los datos hacen lo que dice H1 de forma muy evidente.

PASO 1: PASO 2: PASO 3:


Caso (c)
𝑋ሜ − 290
𝐻0 : 𝜇 ≥ 290; 𝐻1 : 𝜇 < 290 𝑇0 =
መ 𝑛 𝑇0~𝑁(0,1)
𝑆/

Rechazamos H0 si

𝑥lj << 290

𝑥lj − 290
𝑡0 = << 0
𝑠/
Ƹ 𝑛

Si H0 es falsa N(0,1)
tenderemos a estar por
esta zona

0
ESTADÍSTICA BÁSICA www.edbudep.com
57
La región de rechazo está donde ‘señala’ H1

H 0 : m = m 0 ; H1 : m  m 0 H 0 : m  m 0 ; H1 : m  m 0

H 0 : m  m 0 ; H1 : m  m 0 Rechazo H0
Acepto H0
Rechazo H0 Rechazo H0

Acepto H0
Acepto H0
Rechazo H0

ESTADÍSTICA BÁSICA www.edbudep.com


58
Metodología general para hacer un contraste de hipótesis

PASO 1: Especificamos la hipótesis nula y la alternativa.

PASO 2: Estadístico de contraste

PASO 3: Distribución de referencia

PASO 4: Localizamos las zonas donde estará la región de rechazo

Rechazo H0 Acepto H0

¿Qué área ocupa la región de rechazo?

• La región de rechazo ocupa un área pequeña


?
• Ese área se llama α=nivel de significación
• Su valor lo decide el analista
Valor crítico
• Suele ser α=0.05, 0.10, 0.01

𝛼 representa cuán improbable ha de ser nuestra muestra para concluir


que no ha sido generada por una población que cumpla 𝐻0
ESTADÍSTICA BÁSICA www.edbudep.com
59
PASO 4:
PASO 1: PASO 2:

Rechazo H0 Rechazo H0
H 0 : m = m 0 ; H1 : m  m 0
Acepto H0
(a)
(a) −𝑧𝛼/2 𝑧𝛼/2

Acepto H0 Rechazo H0

H 0 : m  m 0 ; H1 : m  m 0
(b)
(b)
𝑧𝛼

PASO 3:

H 0 : m  m 0 ; H1 : m  m 0 N(0,1) Rechazo H0
Acepto H0
(c)

(c)
−𝑧𝛼

La región de rechazo está donde señala H1

ESTADÍSTICA BÁSICA www.edbudep.com


60
Ejemplo En el ejemplo de los transistores. Se desea saber si la ganancia en corriente del proceso productivo mantiene la media en
μ0 =290
H0 H1
𝛽 𝜇 = 290
𝜇 = 290 𝜇 ≠ 290
𝜎 2 = 760

𝜇 = 290
Con 100 observaciones:

Nivel de significación, α=0.05 T0~N(0,1)

Acepto H0
Rechazo H0 Rechazo H0

α/2=0.025 α/2=0.025

-3 -2 -1 0 1 2 3
-1.96 1.96
Rechazamos H0 -2.78
Valores críticos
ESTADÍSTICA BÁSICA www.edbudep.com
61
Ejemplo En el ejemplo de los transistores. Se desea saber si la población de transistores del proceso
productivo mantiene la media en μ0 =290
H0 H1
𝜇 = 290 𝜇 ≠ 290

Con 100 observaciones:

Nivel de significación, α=0.05


T0~N(0,1)

La diferencia entre la media de la muestra


(282.3) y la de la hipótesis (290) es
significativa (al 5%)

Inferimos, con un nivel de significación del


5%, que la media poblacional ha cambiado

Hay una probabilidad inferior al 5% de que si


𝜇 = 290 se haya obtenido una muestra tan
alejada como la nuestra

ESTADÍSTICA BÁSICA www.edbudep.com


62
Ejemplo Según los estudios antropométricos, los jóvenes españoles entre 18 y 25 años tienen una estatura media de μ0 =177 cm.
Se toman las alturas de 50 jóvenes madrileños en ese rango de edad y resulta
x = 175.9cm sˆ = 5.93cm
¿Hay evidencia suficiente para decir que los jóvenes madrileños tiene una estatura media inferior a la nacional?

PASO 1: Especificamos la hipótesis nula y la alternativa.

¿Los jóvenes madrileños tiene una


estatura media inferior a la nacional?

SI NO

𝜇 < 177 𝜇 ≥ 177

𝐻1 𝐻0

𝐻0 : 𝜇 ≥ 177
𝐻1 : 𝜇 < 177

ESTADÍSTICA BÁSICA www.edbudep.com


63
Ejemplo Según los estudios antropométricos, los jóvenes españoles entre 18 y 25 años tienen una estatura media de μ0 =177 cm.
Se toman las alturas de 50 jóvenes madrileños en ese rango de edad y resulta
H 0 : m  177 x = 175.9cm sˆ = 5.93cm
H1 : m  177 ¿Hay evidencia suficiente para decir que los jóvenes madrileños tiene una estatura media inferior a la nacional?

PASO 2: Estadístico de contraste

PASO 3: Distribución de referencia N(0,1)

PASO 4: Localizamos las zonas donde estará la región de rechazo

La diferencia entre la media muestral (175.9) Acepto H0


y la hipótesis nula no es significativa (al 5%) Rechazo H0

α=0.05
La diferencia observada se atribuye, con un nivel de
significatividad del 5%, a la variabilidad de la muestra
y no a diferencias reales -3 -2 -1 0 1 2 3
Valor crítico=-1.65
-1.31

ESTADÍSTICA BÁSICA www.edbudep.com


64
1
2

ESTADÍSTICA BÁSICA www.edbudep.com


65
Tema 6. Inferencia con muestras grandes

1. Intervalos de confianza para μ con muestras grandes


Z ~ N(0,1) 2. Determinación del tamaño muestral
3. Introducción al contraste de hipótesis
1- a
4. Contraste de hipótesis de la media μ con muestras grandes
5. Interpretación de un contraste usando el p-valor
a /2 a /2 6. Relación entre contrastes de hipótesis e intervalos de confianza
7. Inferencia sobre una proporción con muestras grandes
0
-4 -3 -2 -1 0 1 2 3 4
-z a/2 za/2

ESTADÍSTICA BÁSICA www.edbudep.com


66
5. Interpretación de un contraste usando el pvalor

El resultado de un contraste tiene dos elementos:

1. Aceptamos o rechazamos H0 Conclusión del contraste


2. El nivel de significación 𝛼 Medida de su incertidumbre

El nivel de significación es una medida de incertidumbre poco precisa

El pvalor es una medida alternativa de la


incertidumbre al resolver un contraste
que proporciona más información

ESTADÍSTICA BÁSICA www.edbudep.com


67
En una piscifactoría se cultivan langostinos. Los langostinos se cultivan en piscinas, todos al
mismo tiempo (campaña). Tras 10 semanas de cultivo se espera que el peso medio de los
langostinos sea de 11 gramos.

Para monitorear el crecimiento, en cada piscina se toma una muestra de 50 langostinos, y


se contrasta a partir de esa muestra si el peso medio de las piscinas alcanza el objetivo de
los 11 gramos.

¿Se está alcanzado ese peso medio en cada piscina?

SI NO

𝜇 ≥ 11 𝜇 < 11

𝐻0 𝐻1

El contraste es: 𝐻0 : 𝜇 ≥ 11
𝐻1 : 𝜇 < 11

ESTADÍSTICA BÁSICA www.edbudep.com


68
Para monitorear el crecimiento, en cada piscina se toma una muestra de 50 langostinos, y
se contrasta a partir de esa muestra si el peso medio de las piscinas alcanza el objetivo de
los 11 gramos.(en cada piscina hay más de 100 mil langostinos, es como una población
infinita)
¿Se está alcanzado ese peso medio en cada piscina?

𝐻0 : 𝜇 ≥ 11
𝐻1 : 𝜇 < 11

Piscina 1 Piscina 2

𝑛1 = 50 𝑥1ҧ − 11 10.6 − 11 𝑛2 = 50 𝑥ҧ2 − 11 10.5 − 11


𝑥1ҧ = 10.6 𝑡= = = −1.66 𝑥ҧ2 = 10.5 𝑡= = = −2.53
𝑠Ƹ1 1.7ൗ 𝑠Ƹ2 1.4ൗ
𝑠Ƹ1 = 1.7 ൘ 50 𝑠Ƹ 2 = 1.4 ൘ 50
50 50

Rechazo H0 Rechazo H0
Acepto H0 Acepto H0
𝛼 = 0.05 𝛼 = 0.05

−1.645 −1.645
−1.66 −2.53

Con un nivel de significación del 5%, se rechaza 𝐻0 Con un nivel de significación del 5%, se rechaza 𝐻0

ESTADÍSTICA BÁSICA www.edbudep.com


69
Para monitorear el crecimiento, en cada piscina se toma una muestra de 50 langostinos, y
se contrasta a partir de esa muestra si el peso medio de las piscinas alcanza el objetivo de
los 11 gramos.(en cada piscina hay más de 100 mil langostinos, es como una población
infinita)
¿Se está alcanzado ese peso medio en cada piscina?

𝐻0 : 𝜇 ≥ 11
𝐻1 : 𝜇 < 11

Piscina 1 Piscina 2

𝑛1 = 50 𝑥1ҧ − 11 10.6 − 11 𝑛2 = 50 𝑥ҧ2 − 11 10.5 − 11


𝑥1ҧ = 10.6 𝑡= = = −1.66 𝑥ҧ2 = 10.5 𝑡= = = −2.53
𝑠Ƹ1 1.7ൗ 𝑠Ƹ2 1.4ൗ
𝑠Ƹ1 = 1.7 ൘ 50 𝑠Ƹ 2 = 1.4 ൘ 50
50 50

Rechazo H0 Rechazo H0
Acepto H0 Acepto H0
𝛼 = 0.05 𝛼 = 0.05

−1.645 −1.645
−1.66 −2.53

En ambas piscinas el resultado es el mismo: Rechazamos 𝐻0 con 𝛼 = 0.05


Con un
Sinnivel de significación
embargo, del25%,
en la piscina se rechaza
el rechazo 𝐻0 claro queCon
es más unpiscina
en la nivel de significación
1. Están del 5%,
más seguros deseque
rechaza
el 𝐻0
resultado no es por casualidad.
¿Cómo expresarlo?
ESTADÍSTICA BÁSICA www.edbudep.com
70
El p-valor es el nivel de significación (área de la región de rechazo) que deberíamos usar
para dejar al valor del estadístico de contraste justo en la frontera de la región de rechazo

Piscina 1 Rechazo H0
Acepto H0
𝛼 = 0.05

−1.645
valor crítico
La frontera de la región de rechazo la delimita el
−1.66
valor crítico, y por tanto, su área es el nivel de
significación

ESTADÍSTICA BÁSICA www.edbudep.com


71
El p-valor es el nivel de significación (área de la región de rechazo) que deberíamos usar
para dejar al valor del estadístico de contraste justo en la frontera de la región de rechazo

Piscina 1 Rechazo H0
Acepto H0
𝛼 = 0.05

−1.645

−1.66

Si la frontera de la región de rechazo la delimitan


los datos (el estadístico de contraste) su área nos
proporciona el pvalor

ESTADÍSTICA BÁSICA www.edbudep.com


72
El p-valor es el nivel de significación (área de la región de rechazo) que deberíamos usar
para dejar al valor del estadístico de contraste justo en la frontera de la región de rechazo

Piscina 1
Rechazo H0
Acepto H0
𝛼 = 0.05

pvalor= 0.0485

−1.645

−1.66
Como p-valor < 𝛼 estamos en la Se rechaza 𝐻0 pero por muy poco
región de rechazo
El p-valor es más inforrmativo que decir sólo si rechazamos
o aceptamos. Nos cuantifica cómo de seguros estamps de
nuestra decisión

ESTADÍSTICA BÁSICA www.edbudep.com


73
El p-valor es el nivel de significación (área de la región de rechazo) que deberíamos usar
para dejar al valor del estadístico de contraste justo en la frontera de la región de rechazo

Piscina 2 Rechazo H0
Acepto H0
𝛼 = 0.05

−1.645
−2.53

ESTADÍSTICA BÁSICA www.edbudep.com


74
El p-valor es el nivel de significación (área de la región de rechazo) que deberíamos usar
para dejar al valor del estadístico de contraste justo en la frontera de la región de rechazo

Piscina 2 Rechazo H0
Acepto H0
𝛼 = 0.05

−1.645
−2.53

ESTADÍSTICA BÁSICA www.edbudep.com


75
El p-valor es el nivel de significación (área de la región de rechazo) que deberíamos usar
para dejar al valor del estadístico de contraste justo en la frontera de la región de rechazo

Piscina 2 Rechazo H0
Acepto H0
𝛼 = 0.05

pvalor= 0.0057

−1.645
−2.53

Como p-valor < 𝛼 estamos en la


región de rechazo Se rechaza 𝐻0 pero por mucho margen
Estamos muy seguros de la decisión.
La muestra está muy muy lejos de 𝐻0

ESTADÍSTICA BÁSICA www.edbudep.com


76
Algunas ideas para interpretar el pvalor

El p-valor es el nivel de significación (área de la


región de rechazo) que deberíamos usar para dejar al
Piscina 2 Rechazo H0 valor del estadístico de contraste justo en la frontera
de la región de rechazo
𝛼 = 0.05
Acepto H0
El pvalor es la probabilidad de que una población
que siga 𝐻0 haya generado una muestra tan alejada
de 𝐻0 como la nuestra
pvalor= 0.0057

El pvalor es el respaldo que dan los datos a 𝐻0


−1.645
−2.53
El pvalor me dice cuán rara es nuestra muestra si 𝐻0
Como p-valor < 𝛼 estamos en la
región de rechazo fuese cierta. Cuanto más pequeño es el pvalor, más
lejos están los datos de 𝐻0

ESTADÍSTICA BÁSICA www.edbudep.com


77
𝐻0 : 𝜗 ≥ 𝜗0 ; 𝐻1 : 𝜗 < 𝜗0

Rechazamos H0

Aceptamos H0
Si pvalor ≥ 𝛼
𝛼 p−valor>𝛼 Aceptamos 𝐻0

t0

Si pvalor < 𝛼
Rechazamos 𝐻0

p−valor<𝛼

ESTADÍSTICA BÁSICA
t0 www.edbudep.com
78
𝐻0 : 𝜗 ≤ 𝜗0 ; 𝐻1 : 𝜗 > 𝜗0

Aceptamos H0
Rechazamos H0

𝛼 Si pvalor ≥ 𝛼
p−valor>𝛼
Aceptamos 𝐻0

t0

Si pvalor < 𝛼
Rechazamos 𝐻0

p−valor<𝛼

t0
ESTADÍSTICA BÁSICA www.edbudep.com
79
𝐻0 : 𝜗 = 𝜗0 ; 𝐻1 : 𝜗 ≠ 𝜗0

𝛼/2
𝛼/2
p−valor>𝛼

Si pvalor ≥ 𝛼
Aceptamos 𝐻0

-|t0| |t0|
p-valor: es la suma de las dos áreas

Si pvalor < 𝛼
p−valor>𝛼 Rechazamos 𝐻0

-|t0| |t0|
ESTADÍSTICA BÁSICA www.edbudep.com
80
Problema Se tienen datos de una muestra de resistencias de valor nominal 1000
Ohmios. Hay datos de dos tipos de resistencias. Las de banda marrón
deben tener unos valores más próximos al nominal que los de banda
dorada.
Realiza un contraste de nivel de significación del 5% de que las
resistencias de banda marrón proceden de una población de media
igual al valor nominal 1000.

𝑋 =impedancia de una resistencia eléctrica de banda marrón de valor nominal 1000 Ohmios

𝐻0 : 𝜇 = 1000
𝐻1 : 𝜇 ≠ 1000
Rechazo H0
Acepto H0 Rechazo H0
𝑥ҧ − 1000 999.14 − 1000
𝑡0 = = = −0.87
𝑠/
Ƹ 50 6.99/ 50 𝛼ൗ = 0.025 𝛼ൗ = 0.025
2 2

Es una muestra grande, y podemos usar


como distribución de referencia la N(0,1)

−0.87
−1.96 1.96

ESTADÍSTICA BÁSICA www.edbudep.com


81
Problema Se tienen datos de una muestra de resistencias de valor nominal 1000
Ohmios. Hay datos de dos tipos de resistencias. Las de banda marrón
deben tener unos valores más próximos al nominal que los de banda
dorada.
Realiza un contraste de nivel de significación del 5% de que las
resistencias de banda marrón proceden de una población de media
igual al valor nominal 1000.

𝑋 =impedancia de una resistencia eléctrica de banda marrón de valor nominal 1000 Ohmios

𝐻0 : 𝜇 = 1000
𝐻1 : 𝜇 ≠ 1000
Rechazo H0
Acepto H0 Rechazo H0
𝑥ҧ − 1000 999.14 − 1000
𝑡0 = = = −0.87
𝑠/
Ƹ 50 6.99/ 50 𝛼ൗ = 0.025 𝛼ൗ = 0.025
2 2

Es una muestra grande, y podemos usar


como distribución de referencia la N(0,1)

−0.87 +0.87
−1.96 1.96

ESTADÍSTICA BÁSICA www.edbudep.com


82
Problema Se tienen datos de una muestra de resistencias de valor nominal 1000
Ohmios. Hay datos de dos tipos de resistencias. Las de banda marrón
deben tener unos valores más próximos al nominal que los de banda
dorada.
Realiza un contraste de nivel de significación del 5% de que las
resistencias de banda marrón proceden de una población de media
igual al valor nominal 1000.

𝑋 =impedancia de una resistencia eléctrica de banda marrón de valor nominal 1000 Ohmios

Rechazo H0 Rechazo H0
𝐻0 : 𝜇 = 1000
𝐻1 : 𝜇 ≠ 1000
pvalor/2=0.19 pvalor/2=0.19
Acepto H0
𝑥ҧ − 1000 999.14 − 1000
𝑡0 = = = −0.87
𝑠/
Ƹ 50 6.99/ 50 𝛼ൗ = 0.025 𝛼ൗ = 0.025
2 2

Es una muestra grande, y podemos usar


como distribución de referencia la N(0,1)

−0.87 +0.87
−1.96 1.96
Nuestra muestra nos da mucha seguridad de que la
pvalor=0.19+0.19=0.38
hipótesis nula es cierta
ESTADÍSTICA BÁSICA www.edbudep.com
83
1

ESTADÍSTICA BÁSICA www.edbudep.com


84
Tema 6. Inferencia con muestras grandes

1. Intervalos de confianza para μ con muestras grandes


Z ~ N(0,1) 2. Determinación del tamaño muestral
3. Introducción al contraste de hipótesis
1- a
4. Contraste de hipótesis de la media μ con muestras grandes
5. Interpretación de un contraste usando el p-valor
a /2 a /2 6. Relación entre contrastes de hipótesis e intervalos de confianza
7. Inferencia sobre una proporción con muestras grandes
0
-4 -3 -2 -1 0 1 2 3 4
-z a/2 za/2

ESTADÍSTICA BÁSICA www.edbudep.com


85
6. Relación entre contrastes de hipótesis e intervalos de confianza

Los intervalos de confianza para la media y contrastes bilaterales usan la misma información

𝜎2 𝑋ሜ − 𝜇
𝑋ሜ ∼ 𝑁 𝜇; 𝑇=

~𝑁(0,1)
𝑛 𝑆/ 𝑛

Intervalo de confianza Contraste de hipótesis bilateral

𝑆መ 𝑋ሜ − 𝜇0
𝐼𝐶 1 − 𝛼 : 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2 𝑇0 = ~𝑁(0,1)
𝑛 መ
𝑆/ 𝑛
𝐻0 : 𝜇 = 𝜇0 ; 𝐻1 : 𝜇 ≠ 𝜇0
Se puede demostrar que la realización de un
contraste de hipótesis bilateral
Rechazo H0 Rechazo H0

𝐻0 : 𝜇 = 𝜇0 ; 𝐻1 : 𝜇 ≠ 𝜇0
𝛼/2 Acepto H0 𝛼/2

con nivel de significación 𝛼 es equivalente a realizar t0


un intervalo de confianza de nivel (1 − 𝛼) y
comprobar si μ0 está dentro o fuera de dicho
intervalo.

ESTADÍSTICA BÁSICA www.edbudep.com


86
Ejemplo En el ejemplo de los transistores. Se desea saber si la población de transistores del proceso productivo mantiene la
media en μ0 =290

Con 100 observaciones:


𝐻0 : 𝜇 = 290
𝐻1 : 𝜇 ≠ 290

Contraste de hipótesis

Rechazo H0
Rechazo H0

α/2=0.025 α/2=0.025
Acepto H0
Rechazamos
H0:μ=290
-3 -2 -1 0 1 2 3
-2.78 -1.96 1.96

Intervalo de confianza de nivel (𝟏 − 𝜶)

No contiene al 290

ESTADÍSTICA BÁSICA www.edbudep.com


87
Intervalo de confianza de nivel (𝟏 − 𝒂)
No contiene al 290

Los valores de un intervalo de confianza


de nivel (1 − 𝛼) son hipótesis nulas
𝐻0 : 𝜇 = 𝜇0 que no podremos rechazar
con nivel de significación 𝛼.

𝐻0 : 𝜇 = 280 𝐻0 : 𝜇 = 278 𝐻0 : 𝜇 = 288 𝐻0 : 𝜇 = 282


Acepto 𝐻0 Acepto 𝐻0 Rechazo 𝐻0 Acepto 𝐻0
𝐻1 : 𝜇 ≠ 280 𝐻1 : 𝜇 ≠ 278 𝐻1 : 𝜇 ≠ 288 𝐻1 : 𝜇 ≠ 282

ESTADÍSTICA BÁSICA www.edbudep.com


88
Tema 6. Inferencia con muestras grandes

1. Intervalos de confianza para μ con muestras grandes


Z ~ N(0,1) 2. Determinación del tamaño muestral
3. Introducción al contraste de hipótesis
1- a
4. Contraste de hipótesis de la media μ con muestras grandes
5. Interpretación de un contraste usando el p-valor
a /2 a /2 6. Relación entre contrastes de hipótesis e intervalos de confianza
7. Inferencia sobre una proporción con muestras grandes
0
-4 -3 -2 -1 0 1 2 3 4
-z a/2 za/2

ESTADÍSTICA BÁSICA www.edbudep.com


89
7. Inferencia sobre una proporción en muestras grandes
Estimación Queremos estimar la proporción de individuos 𝒑 en una población que tendrá cierto atributo

En una muestra de 𝒏 individuos: el estimador es la proporción muestral

𝑋𝑖 = 1 si el elemento sí tiene el atributo


𝑋𝑖 = 0 si el elemento no tiene el atributo
Sea 𝑿𝒊 una variable de Bernoulli para el
elemento i-ésimo de la muestra
𝐸(𝑋𝑖 ) = 𝑝
𝑉𝑎𝑟(𝑋𝑖 ) = 𝑝(1 − 𝑝)

Una proporción muestral es el promedio de las v.a. de Bernoulli de cada observación.


Es una media muestral!!

ESTADÍSTICA BÁSICA www.edbudep.com


90
7. Inferencia sobre una proporción en muestras grandes

Ejemplo: Lanzo una moneda 6 veces. Si sale cara: 𝑋𝑖 = 1 . Si sale sello 𝑋𝑖 = 0.

Si obtengo 3 caras, ¿Cuál es la proporción de veces que sale cara?

1+1+1+0+0+0
𝑝Ƹ = = 0.5
6

𝑝Ƹ es un caso particular de media muestral, y


podemos utilizar sus propiedades muestrales

ESTADÍSTICA BÁSICA www.edbudep.com


91
7. Inferencia sobre una proporción en muestras grandes

Es la media muestral de n variables aleatorias de Bernoulli

• La suma de n variables de Bernoulli se 𝐸 𝑋1 + ⋯ + 𝐸 𝑋𝑛


𝐸 𝑝Ƹ = =𝑝
aproximará a una normal si 𝑛𝑝 1 − 𝑝 > 5 𝑛
(Tema 4)
𝑉𝑎𝑟 𝑋1 + ⋯ + 𝑉𝑎𝑟 𝑋𝑛 𝑝(1 − 𝑝)
𝑉𝑎𝑟 𝑝Ƹ = =
𝑛 𝑛
• 𝑝Ƹ es una media muestral de v.a. de
Bernoullis.

• Si 𝑛𝑝 1 − 𝑝 > 5 𝑝Ƹ se aproximará a una


𝑝 1−𝑝
𝑝Ƹ ∼ 𝑁 𝑝;
normal 𝑛

ESTADÍSTICA BÁSICA www.edbudep.com


92
7. Inferencia sobre una proporción en muestras grandes
Intervalo de confianza

Al ser una media muestral asintóticamente


normal, se pueden usar los mismos
resultados ya vistos para la media muestral

Caso general de 𝜇 estimada con 𝑋ത Caso particular de 𝑝 estimada con 𝑝Ƹ

ሜ =𝜇
𝐸(𝑋)
𝑋ത − 𝐸 𝑋ത 𝐸 𝑝Ƹ = 𝑝 𝑝Ƹ − 𝐸 𝑝Ƹ
∼ 𝑁(0,1) ∼ 𝑁(0,1)
ሜ = 𝜎 2 /𝑛
𝑉𝑎𝑟(𝑋) ത
𝑉𝑎𝑟(𝑋) 𝑝(1 − 𝑝) 𝑉𝑎𝑟 𝑝Ƹ
𝑉𝑎𝑟 𝑝Ƹ =
𝑛

𝑠Ƹ
𝜇 ∈ 𝑋ሜ ± 𝑧𝛼Τ2 𝑉𝑎𝑟 𝑋ሜ ⇒ 𝜇 ∈ 𝑋ത ± 𝑧𝛼Τ2
𝑛 𝑝Ƹ 1 − 𝑝Ƹ
𝐼𝐶 1 − 𝛼 : 𝑝 ∈ 𝑝Ƹ ± 𝑧𝛼Τ2
𝑛

ESTADÍSTICA BÁSICA www.edbudep.com


93
Ejemplo Con el objeto de determinar la proporción de personas que poseen auto en una provincia
determinada se realizó un muestreo aleatorio simple, de tal forma que de los 100 encuestados, 30 de
ellos tienen auto.
Calcula un intervalo de confianza del 95% para la proporción de personas con auto en la provincia

𝑛𝑝Ƹ 1 − 𝑝Ƹ = 100 0.3 0.7 = 21 > 5

La aproximación a la normal será buena.


El intervalo tendrá una confianza muy próxima al 95%.

𝑝Ƹ 1 − 𝑝Ƹ
𝐼𝐶 1 − 𝛼 : 𝑝 ∈ 𝑝Ƹ ± 𝑧𝛼Τ2
𝑛

margen de error L=0.09

ESTADÍSTICA BÁSICA www.edbudep.com


94
Tamaño muestral

¿Cuanto debe valer n para tener un


margen de error L determinado?

2
𝑝(1 − 𝑝) 𝑧 𝛼Τ2 𝑝 1 − 𝑝
𝐿 = 𝑧 𝛼 Τ2 ⇒𝑛= Estimación
𝑛 𝐿 previa con una
muestra piloto

Ejemplo Con el objeto de determinar la proporción de personas que poseen auto en una provincia determinada se
realizó un muestreo aleatorio simple, de tal forma que de los 100 encuestados, 30 de ellos tienen auto.
Calcula n para que en un intervalo del 95%, se tenga L=0.02

2
1.96 0.3 1−0.3
𝑛= = 2017 encuestados
0.02

ESTADÍSTICA BÁSICA www.edbudep.com


95
Tamaño muestral 2
𝑝(1 − 𝑝) 𝑧 𝛼Τ2 𝑝 1 − 𝑝
𝐿 = 𝑧 𝛼 Τ2 ⇒𝑛=
𝑛 𝐿

Otra opción para calcular 𝑛 es usar el valor de 𝑝(1 − 𝑝) más


desfavorable. Tendremos un valor de n sobredimensionado, 𝒑(𝟏 − 𝒑)
pero que garantiza un margen de error de 𝐿
0.25

2
𝑧 𝛼Τ2 0.5 1 − 0.5 𝑧 𝛼Τ2 2
𝑛= =
𝐿 2𝐿
0.5 𝒑

En el ejemplo anterior con L=0.02

ESTADÍSTICA BÁSICA www.edbudep.com


96
Contraste de hipótesis PASO 4:

PASO 2:
PASO 1:
Rechazo H0 Rechazo H0
(a) 𝐻0 : 𝑝 = 𝑝0 ; 𝐻1 : 𝑝 ≠ 𝑝0 𝑝ො − 𝑝0 Acepto H0
𝑍0 =
𝑝0 𝑞0 /𝑛
(a) −𝑧𝛼/2 𝑧𝛼/2

Rechazo H0
(b) Acepto H0
𝐻0 : 𝑝 ≤ 𝑝0 ; 𝐻1 : 𝑝 > 𝑝0

(b)
𝑧𝛼
PASO 3:

N(0,1)
(c) 𝐻0 : 𝑝 ≥ 𝑝0 ; 𝐻1 : 𝑝 < 𝑝0 Rechazo H0 Acepto H0
𝑛𝑝0 𝑞0 > 5

(c) −𝑧𝛼

La región de rechazo está donde señala H1

ESTADÍSTICA BÁSICA www.edbudep.com


97
Ejemplo Un proceso productivo que fabrica semiconductores produce un 2% de artículos defectuosos
cuando funciona adecuadamente. Se adquiere una nueva máquina basada en una tecnología
más avanzada. Después de producir 300 artículos se encuentra que 3 son defectuosos (1%). ¿Se
puede afirmar que la nueva máquina ha mejorado la calidad de la producción?

La nueva máquina SI mejora el proceso 𝑝 < 0.02

Dos opciones
𝑝 ≥ 0.02
La nueva máquina NO mejora el proceso
ó 𝑝 = 0.02

𝑛𝑝0 𝑞0 = 300 × 0.02 × 1 − 0.02 = 5.88 > 5

𝑝Ƹ − 𝑝0 0.01 − 0.02
𝑧0 = = = −1.24
𝑝0 𝑞0 /𝑛 (0.02)(0.98)/300

Rechazo H0
Acepto H0

No podemos rechazar, con un nivel de significación del 5%, que el proceso siga
igual.
La diferencia observada no es significativa, y puede deberse al azar (a la -1.645
casualidad).
-1.24

ESTADÍSTICA BÁSICA www.edbudep.com


98
1
2

Con la aproximación a la normal se hace


como en las diapositivas. Con la ‘exacta’ se
5
basa en la distribución binomial

ESTADÍSTICA BÁSICA www.edbudep.com


99

También podría gustarte