Documentos de Académico
Documentos de Profesional
Documentos de Cultura
03 Inferencia Estadística (Parte 1)
03 Inferencia Estadística (Parte 1)
ESTADÍSTICA
APLICADA AL
LABORATORIO
Introducción a la inferencia
estadı́stica
Cristhian Paredes
Contenido
1. Introducción
5
Introducción
Estadı́stica descriptiva para resumir información
Introducción
Descriptores estadı́sticos
Descriptores estadı́sticos
De localización: De dispersión: De forma:
x S2
(−) (+)
Me
Leptocúrtica
RSD1 = RSD2 = 10%
Meso~
Plato~
7
Introducción
Población estadı́stica y muestra estadı́stica
Introducción
Población estadı́stica y muestra estadı́stica
8
Introducción
Población estadı́stica y muestra estadı́stica
Fracción másica de arsénico en una pi;a.
Garzón, D., et al. J. Braz. Chem. Soc., Vol. 31, No. 6, 1296-1305, 2020.
9
Introducción
Población estadı́stica y muestra estadı́stica
10
Introducción
Descriptores poblacionales y muestrales
µ x̄
σ2 Vs. s2
σ s
(Parámetros) (Estadı́sticos)
11
Introducción
Probabilidad estadı́stica:
Valor al que tiende la frecuencia relativa con la que ocurre un evento.
n(A)
P(A) = lı́m (1)
n→∞ n
0.5
0.4
Proporción
0.3
n(A)
P(A) = lı́m (1)
n→∞ n
0.5
0.4
Proporción
0.3
Probabilidad
1 2 3 4 5 6
Lanzamiento de un dado
14
Introducción
Función de densidad de probabilidad
Función de densidad de probabilidad
1 2 3 4 5 6
Lanzamiento de un dado
15
Introducción
Distribución normal y su función de densidad de probabilidad
16
Introducción
Distribución normal y su función de densidad de probabilidad
x ± 2s = 95%
x ± s = 68%
17
Introducción
Inferencias en la distribución normal: Fracción másica de potasio en un fertilizante
Distribución normal: µ = 14.7 σ = 0.2 [ %]
P(x̄0 ≤ 14.7) = 0.5
P(x̄0 > 14.7) = 0.5
18
Introducción
Inferencias en la distribución normal: Fracción másica de potasio en un fertilizante
Distribución normal: µ = 14.7 σ = 0.2 [ %]
P(x̄0 ≤ 14.7) = 0.5
P(x̄0 > 14.7) = 0.5
Función de densidad de probabilidad
18
Introducción
Inferencias en la distribución normal: Fracción másica de potasio en un fertilizante
Introducción
Inferencias en la distribución normal: Fracción másica de potasio en un fertilizante
= (2)
x0 − µ 14.3 − 14.7
Z0 =
0.20
= −2
σx̄
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
= (2)
x0 − µ 14.3 − 14.7
Z0 =
0.20
= −2
σx̄
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
Introducción
Inferencias en la distribución normal: Fracción másica de potasio en un fertilizante
= (2)
x0 − µ 14.3 − 14.7
Z0 =
0.20
= −2
σx̄
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
= (2)
x0 − µ 14.3 − 14.7
Z0 =
0.20
= −2
σx̄
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
Introducción
Inferencias en la distribución normal: Fracción másica de potasio en un fertilizante
= (2)
x0 − µ 14.3 − 14.7
Z0 =
0.20
= −2
σx̄
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
= (2)
x0 − µ 14.3 − 14.7
Z0 =
0.20
= −2
σx̄
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
Introducción
Inferencias en la distribución normal: Fracción másica de potasio en un fertilizante
= (2)
x0 − µ 14.3 − 14.7
Z0 =
0.20
= −2
σx̄
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
= (2)
x0 − µ 14.3 − 14.7
Z0 =
0.20
= −2
σx̄
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
(4) (7)
x̄ − µ x̄ − µ
∼ DNE ∼ t(ν)
σx̄ √s
n
√
donde σx̄ = σ/ n, y σ es la desviación estándar Para cuando n no es tan grande...
poblacional.
σ =?? (5) El parámetro ν es el número de grados de
libertad: ν = n − 1.
Si n es grande: σ ≈ s:
n
i=1 (xi
s= (6)
− x̄)2
sP
n−1
(4) (7)
x̄ − µ x̄ − µ
∼ DNE ∼ t(ν)
σx̄ √s
n
√
donde σx̄ = σ/ n, y σ es la desviación estándar Para cuando n no es tan grande...
poblacional.
σ =?? (5) El parámetro ν es el número de grados de
libertad: ν = n − 1.
Si n es grande: σ ≈ s:
n
i=1 (xi
s= (6)
− x̄)2
sP
n−1
(4) (7)
x̄ − µ x̄ − µ
∼ DNE ∼ t(ν)
σx̄ √s
n
√
donde σx̄ = σ/ n, y σ es la desviación estándar Para cuando n no es tan grande...
poblacional.
σ =?? (5) El parámetro ν es el número de grados de
libertad: ν = n − 1.
Si n es grande: σ ≈ s:
n
i=1 (xi
s= (6)
− x̄)2
sP
n−1
(4) (7)
x̄ − µ x̄ − µ
∼ DNE ∼ t(ν)
σx̄ √s
n
√
donde σx̄ = σ/ n, y σ es la desviación estándar Para cuando n no es tan grande...
poblacional.
σ =?? (5) El parámetro ν es el número de grados de
libertad: ν = n − 1.
Si n es grande: σ ≈ s:
n
i=1 (xi
s= (6)
− x̄)2
sP
n−1
(4) (7)
x̄ − µ x̄ − µ
∼ DNE ∼ t(ν)
σx̄ √s
n
√
donde σx̄ = σ/ n, y σ es la desviación estándar Para cuando n no es tan grande...
poblacional.
σ =?? (5) El parámetro ν es el número de grados de
libertad: ν = n − 1.
Si n es grande: σ ≈ s:
n
i=1 (xi
s= (6)
− x̄)2
sP
n−1
(4) (7)
x̄ − µ x̄ − µ
∼ DNE ∼ t(ν)
σx̄ √s
n
√
donde σx̄ = σ/ n, y σ es la desviación estándar Para cuando n no es tan grande...
poblacional.
σ =?? (5) El parámetro ν es el número de grados de
libertad: ν = n − 1.
Si n es grande: σ ≈ s:
n
i=1 (xi
s= (6)
− x̄)2
sP
n−1
ν=2
22
ν=5
Función de densidad de probabilidad
Función de densidad de probabilidad
Fracción másica de potasio en la muestra estadística (%) Fracción másica de potasio en la muestra estadística (%)
22
Comparación de medias muestrales
Distribución normal Distribución t de Student
ν = 30
22
15.0 15.0
14.5 14.5
Fracción másica de potasio (%)
Fracción másica de potasio (%)
14.0 14.0
23
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
15.0 15.0
14.5 14.5
23
15.0 15.0
14.5 14.5
Fracción másica de potasio (%)
Fracción másica de potasio (%)
14.0 14.0
23
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
24
Razonamiento:
¿La muestra viene de una población con µ = 15 [ %]?
¿La diferencia entre nuestra media muestral y el promedio poblacional pudo
surgir por la mera aleatoriedad de los datos?
¿La diferencia que observamos es estadı́sticamente significativa?
Pruebas de hipótesis/comparación/inferencia:
25
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Razonamiento:
¿La muestra viene de una población con µ = 15 [ %]?
¿La diferencia entre nuestra media muestral y el promedio poblacional pudo
surgir por la mera aleatoriedad de los datos?
¿La diferencia que observamos es estadı́sticamente significativa?
Pruebas de hipótesis/comparación/inferencia:
25
Razonamiento:
¿La muestra viene de una población con µ = 15 [ %]?
¿La diferencia entre nuestra media muestral y el promedio poblacional pudo
surgir por la mera aleatoriedad de los datos?
¿La diferencia que observamos es estadı́sticamente significativa?
Pruebas de hipótesis/comparación/inferencia:
25
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Razonamiento:
¿La muestra viene de una población con µ = 15 [ %]?
¿La diferencia entre nuestra media muestral y el promedio poblacional pudo
surgir por la mera aleatoriedad de los datos?
¿La diferencia que observamos es estadı́sticamente significativa?
Pruebas de hipótesis/comparación/inferencia:
25
Razonamiento:
¿La muestra viene de una población con µ = 15 [ %]?
¿La diferencia entre nuestra media muestral y el promedio poblacional pudo
surgir por la mera aleatoriedad de los datos?
¿La diferencia que observamos es estadı́sticamente significativa?
Pruebas de hipótesis/comparación/inferencia:
25
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Razonamiento:
¿La muestra viene de una población con µ = 15 [ %]?
¿La diferencia entre nuestra media muestral y el promedio poblacional pudo
surgir por la mera aleatoriedad de los datos?
¿La diferencia que observamos es estadı́sticamente significativa?
Pruebas de hipótesis/comparación/inferencia:
25
Pruebas de hipótesis/comparación/inferencia:
Pruebas de hipótesis/comparación/inferencia:
Pruebas de hipótesis/comparación/inferencia:
Pruebas de hipótesis/comparación/inferencia:
Pruebas de hipótesis/comparación/inferencia:
Pruebas de hipótesis/comparación/inferencia:
0.3
0.2
0.1
Función de densidad de probabilidad
0.0
0.3
0.2
0.1
0.3
0.2
0.1
Función de densidad de probabilidad
0.0
0.3
0.2
0.1
H1 : µ 6= 15 [ %] (10)
Las diferencias son importantes cuando son por déficit y cuando son por exceso.
28
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
H1 : µ 6= 15 [ %] (10)
Las diferencias son importantes cuando son por déficit y cuando son por exceso.
28
H1 : µ 6= 15 [ %] (10)
Las diferencias son importantes cuando son por déficit y cuando son por exceso.
28
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
H1 : µ 6= 15 [ %] (10)
Las diferencias son importantes cuando son por déficit y cuando son por exceso.
28
0.3
0.2
0.1
Función de densidad de probabilidad
0.0
P(t(ν=6) < −2.646 || t(ν=6) > 2.646) = 2 × P(t(ν=6) < −2.646) = 0.0382 (12)
29
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
0.3
0.2
0.1
P(t(ν=6) < −2.646 || t(ν=6) > 2.646) = 2 × P(t(ν=6) < −2.646) = 0.0382 (12)
29
0.3
0.2
0.1
Función de densidad de probabilidad
0.0
P(t(ν=6) < −2.646 || t(ν=6) > 2.646) = 2 × P(t(ν=6) < −2.646) = 0.0382 (12)
29
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
H0 : µ = 15 [ %] H1 : µ 6= 15 [ %] (13)
H0 es cierta H1 es cierta
Se acepta H0 Verdadero positivo Error tipo II: Falso negativo
Se rechaza H0 Error tipo I: Falso positivo Verdadero negativo
30
H0 : µ = 15 [ %] H1 : µ 6= 15 [ %] (13)
H0 es cierta H1 es cierta
Se acepta H0 Verdadero positivo Error tipo II: Falso negativo
Se rechaza H0 Error tipo I: Falso positivo Verdadero negativo
30
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
H0 : µ = 15 [ %] H1 : µ 6= 15 [ %] (13)
H0 es cierta H1 es cierta
Se acepta H0 Verdadero positivo Error tipo II: Falso negativo
Se rechaza H0 Error tipo I: Falso positivo Verdadero negativo
30
H0 : µ = 15 [ %] H1 : µ 6= 15 [ %] (13)
H0 es cierta H1 es cierta
Se acepta H0 Verdadero positivo Error tipo II: Falso negativo
Se rechaza H0 Error tipo I: Falso positivo Verdadero negativo
30
Comparación de medias muestrales
Error tipo I y error tipo II
Error tipo I:
Rechazar la hipótesis nula cuando esta es cierta: falso positivo.
P(error tipo I) = α
Nivel de significancia. Lo definimos nosotros antes de recolectar datos.
Valores usuales son 0.05, 0.1 y 0.01.
31
Error tipo I:
Rechazar la hipótesis nula cuando esta es cierta: falso positivo.
P(error tipo I) = α
Nivel de significancia. Lo definimos nosotros antes de recolectar datos.
Valores usuales son 0.05, 0.1 y 0.01.
31
Comparación de medias muestrales
Error tipo I y error tipo II
Error tipo I:
Rechazar la hipótesis nula cuando esta es cierta: falso positivo.
P(error tipo I) = α
Nivel de significancia. Lo definimos nosotros antes de recolectar datos.
Valores usuales son 0.05, 0.1 y 0.01.
31
µ1 = 3 µ2 = 7
FDP
En resumen...
Cuando el valor p es menor a la significancia de la prueba:
En caso contrario...
Si el valor p es mayor a la significancia de la prueba:
En resumen...
Cuando el valor p es menor a la significancia de la prueba:
En caso contrario...
Si el valor p es mayor a la significancia de la prueba:
En resumen...
Cuando el valor p es menor a la significancia de la prueba:
En caso contrario...
Si el valor p es mayor a la significancia de la prueba:
En resumen...
Cuando el valor p es menor a la significancia de la prueba:
En caso contrario...
Si el valor p es mayor a la significancia de la prueba:
34
34
Nivel de confianza
Nivel de confianza:
Es la probabilidad de que no se cometa un error tipo I.
35
Nivel de confianza
Nivel de confianza:
Es la probabilidad de que no se cometa un error tipo I.
35
Nivel de confianza
Nivel de confianza:
Es la probabilidad de que no se cometa un error tipo I.
35
Aplicativo validaR
https://crparedes.shinyapps.io/validaR/
µ = 15 [ %]
XK2 O [ %]
14.4
14.7
15.2
14.3
14.7
14.7
14.9
36
Aplicativo validaR
https://crparedes.shinyapps.io/validaR/
µ = 15 [ %]
XK2 O [ %]
14.4
14.7
15.2
14.3
14.7
14.7
14.9
36
H0 : x̄ = µ H1 : x̄ < µ (15)
(No es importante si hay menos contaminante, nos importa solo si la muestra se pasa)
H0 : x̄ = µ H1 : x̄ > µ (16)
(No es importante si el rendimiento del nuevo proceso es menor, nos importa solo si mejora)
H0 : x̄ = µ H1 : x̄ < µ (15)
(No es importante si hay menos contaminante, nos importa solo si la muestra se pasa)
H0 : x̄ = µ H1 : x̄ > µ (16)
(No es importante si el rendimiento del nuevo proceso es menor, nos importa solo si mejora)
H0 : x̄ = µ H1 : x̄ < µ (15)
(No es importante si hay menos contaminante, nos importa solo si la muestra se pasa)
H0 : x̄ = µ H1 : x̄ > µ (16)
(No es importante si el rendimiento del nuevo proceso es menor, nos importa solo si mejora)
H0 : x̄ = µ H1 : x̄ < µ (15)
(No es importante si hay menos contaminante, nos importa solo si la muestra se pasa)
H0 : x̄ = µ H1 : x̄ > µ (16)
(No es importante si el rendimiento del nuevo proceso es menor, nos importa solo si mejora)
Ejemplo práctico
Comparación de media muestral contra valor de referencia
38
Ejemplo práctico
Comparación de media muestral contra valor de referencia
t= (18)
x −y
1
sx,y n1x + ny
q
nx + ny − 2
ν =nx + ny − 2 (20)
40
t= (18)
x −y
1
sx,y n1x + ny
q
nx + ny − 2
ν =nx + ny − 2 (20)
40
Comparación de medias muestrales independientes
Prueba t de Student para dos muestras independientes
t= (18)
x −y
1
sx,y n1x + ny
q
nx + ny − 2
ν =nx + ny − 2 (20)
40
t= (18)
x −y
1
sx,y n1x + ny
q
nx + ny − 2
ν =nx + ny − 2 (20)
40
Comparación de medias muestrales independientes
Prueba t de Student para dos muestras independientes
x̄ contra una referencia µ:
t= (21)
x̄ − µ
√
s/ n
x̄ contra ȳ cuando los grupos son independientes y de varianzas diferentes:
(22)
x −y
sx2 sy2
nx + ny
t =r
sx2 sy2
nx + ny
2
ν= (23)
1 sx2 1 sy2
nx −1 nx + ny −1 ny
2 2
41
(22)
x −y
sx2 sy2
nx + ny
t =r
sx2 sy2
nx + ny
2
ν= (23)
1 sx2 1 sy2
nx −1 nx + ny −1 ny
2 2
41
Ejemplo práctico
Comparación de dos medias muestrales independientes
42
Ejemplo práctico
Comparación de dos medias muestrales independientes
Dos conjuntos están emparejados cuando los datos de uno guardan una relación
estrecha con los datos del otro.
44
Dos conjuntos están emparejados cuando los datos de uno guardan una relación
estrecha con los datos del otro.
44
Comparación de medias muestrales de conjuntos emparejados
Dos conjuntos están emparejados cuando los datos de uno guardan una relación
estrecha con los datos del otro.
44
Dos conjuntos están emparejados cuando los datos de uno guardan una relación
estrecha con los datos del otro.
44
Comparación de medias muestrales de conjuntos emparejados
Si las muestras estadı́sticas provienen de poblaciones con distribución normal las
diferencias entre cada pareja de datos Di = xi − yi tiene distribución t de Student
con grados de libertad ν = n − 1 donde n es el número de parejas:
D
t= √ (24)
sD / n
H0 : D̄ = 0 H1 :D̄ 6= 0 (25)
45
D
t= √ (24)
sD / n
H0 : D̄ = 0 H1 :D̄ 6= 0 (25)
45
Comparación de medias muestrales de conjuntos emparejados
Si las muestras estadı́sticas provienen de poblaciones con distribución normal las
diferencias entre cada pareja de datos Di = xi − yi tiene distribución t de Student
con grados de libertad ν = n − 1 donde n es el número de parejas:
D
t= √ (24)
sD / n
H0 : D̄ = 0 H1 :D̄ 6= 0 (25)
45
Ejemplo práctico
Comparación de dos medias muestrales de conjuntos emparejados
47
Ejemplo práctico
Comparación de dos medias muestrales de conjuntos emparejados
48
Comparación de métodos analı́ticos
Regresión lineal
49