Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA
APLICADA AL
LABORATORIO
Introducción a la inferencia
estadı́stica
Cristhian Paredes
Contenido
1. Introducción
Texto
Rereferencias
Introducción
Distribución normal, inferencia estadı́stica y pruebas de comparación
Introducción
Variabilidad en nuestros resultados
Texto
Rereferencias
5
Introducción
Estadı́stica descriptiva para resumir información
Texto
Rereferencias
6
Introducción
Descriptores estadı́sticos
Descriptores estadı́sticos
De localización: De dispersión: De forma:
x S2
Me
Leptocúrtica
RSD1 = RSD2 = 10%
Meso~
Plato~
Rereferencias
7
Introducción
Población estadı́stica y muestra estadı́stica
Texto
Rereferencias
8
Introducción
Población estadı́stica y muestra estadı́stica
Texto
Rereferencias
8
Introducción
Población estadı́stica y muestra estadı́stica
Fracción másica de arsénico en una pi;a.
Texto
Garzón, D., et al. J. Braz. Chem. Soc., Vol. 31, No. 6, 1296-1305, 2020.
Rereferencias
9
Introducción
Población estadı́stica y muestra estadı́stica
Texto
Rereferencias
10
Introducción
Descriptores poblacionales y muestrales
µ x̄
Texto
σ2 Vs. s2
σ s
(Parámetros) (Estadı́sticos)
Rereferencias
11
Introducción
Probabilidad estadı́stica:
Valor al que tiende la frecuencia relativa con la que ocurre un evento.
n(A)
P(A) = lı́m (1)
n→∞ n
Texto
0.5
Proporción
0.4
0.3
n(A)
P(A) = lı́m (1)
n→∞ n
Texto
0.5
Proporción
0.4
0.3
Texto
Probabilidad
1 2 3 4 5 6
Lanzamiento de un dado
Rereferencias
14
Introducción
Función de densidad de probabilidad
Texto
1 2 3 4 5 6
Lanzamiento de un dado
Rereferencias
15
Introducción
Distribución normal y su función de densidad de probabilidad
x
Texto
Rereferencias
16
Introducción
Distribución normal y su función de densidad de probabilidad
x ± 2s = 95%
x ± s = 68%
Texto
Rereferencias
17
Introducción
Inferencias en la distribución normal: Fracción másica de potasio en un fertilizante
Distribución normal: µ = 14.7 σ = 0.2 [ %]
P(x̄0 ≤ 14.7) = 0.5
Función de densidad de probabilidad
P(x̄0 > 14.7) = 0.5
Texto
Rereferencias
18
Introducción
Inferencias en la distribución normal: Fracción másica de potasio en un fertilizante
Distribución normal: µ = 14.7 σ = 0.2 [ %]
P(x̄0 ≤ 14.7) = 0.5
Función de densidad de probabilidad
P(x̄0 > 14.7) = 0.5
Texto
Rereferencias
18
Introducción
Inferencias en la distribución normal: Fracción másica de potasio en un fertilizante
Texto
x0 − µ 14.3 − 14.7
Z0 = = = −2 (2)
σx̄ 0.20
Texto
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
x0 − µ 14.3 − 14.7
Z0 = = = −2 (2)
σx̄ 0.20
Texto
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
x0 − µ 14.3 − 14.7
Z0 = = = −2 (2)
σx̄ 0.20
Texto
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
x0 − µ 14.3 − 14.7
Z0 = = = −2 (2)
σx̄ 0.20
Texto
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
x0 − µ 14.3 − 14.7
Z0 = = = −2 (2)
σx̄ 0.20
Texto
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
x0 − µ 14.3 − 14.7
Z0 = = = −2 (2)
σx̄ 0.20
Texto
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
x0 − µ 14.3 − 14.7
Z0 = = = −2 (2)
σx̄ 0.20
Texto
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
x0 − µ 14.3 − 14.7
Z0 = = = −2 (2)
σx̄ 0.20
Texto
Antes tocaba mirar en tablas la probabilidad acumulada hasta Z = −2 (valor P).
ν=2
Función de densidad de probabilidad
Fracción másica de potasio en la muestra estadística (%) Fracción másica de potasio en la muestra estadística (%)
Rereferencias
22
Comparación de medias muestrales
Distribución normal Distribución t de Student
ν=5
Función de densidad de probabilidad
Fracción másica de potasio en la muestra estadística (%) Fracción másica de potasio en la muestra estadística (%)
Rereferencias
22
Comparación de medias muestrales
Distribución normal Distribución t de Student
ν = 30
Función de densidad de probabilidad
Fracción másica de potasio en la muestra estadística (%) Fracción másica de potasio en la muestra estadística (%)
Rereferencias
22
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Texto
Fracción másica de potasio (%)
14.5 14.5
14.0 14.0
Rereferencias
23
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Texto
Fracción másica de potasio (%)
14.5 14.5
14.0 14.0
Rereferencias
23
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Texto
Fracción másica de potasio (%)
14.5 14.5
14.0 14.0
Rereferencias
23
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Texto
Rereferencias
24
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Razonamiento:
¿La muestra viene de una población con µ = 15 [ %]?
¿La diferencia entre nuestra media muestral y el promedio poblacional pudo
surgir por la mera aleatoriedad de los datos?
Texto
¿La diferencia que observamos es estadı́sticamente significativa?
Pruebas de hipótesis/comparación/inferencia:
Rereferencias
25
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Razonamiento:
¿La muestra viene de una población con µ = 15 [ %]?
¿La diferencia entre nuestra media muestral y el promedio poblacional pudo
surgir por la mera aleatoriedad de los datos?
Texto
¿La diferencia que observamos es estadı́sticamente significativa?
Pruebas de hipótesis/comparación/inferencia:
Rereferencias
25
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Razonamiento:
¿La muestra viene de una población con µ = 15 [ %]?
¿La diferencia entre nuestra media muestral y el promedio poblacional pudo
surgir por la mera aleatoriedad de los datos?
Texto
¿La diferencia que observamos es estadı́sticamente significativa?
Pruebas de hipótesis/comparación/inferencia:
Rereferencias
25
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Razonamiento:
¿La muestra viene de una población con µ = 15 [ %]?
¿La diferencia entre nuestra media muestral y el promedio poblacional pudo
surgir por la mera aleatoriedad de los datos?
Texto
¿La diferencia que observamos es estadı́sticamente significativa?
Pruebas de hipótesis/comparación/inferencia:
Rereferencias
25
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Razonamiento:
¿La muestra viene de una población con µ = 15 [ %]?
¿La diferencia entre nuestra media muestral y el promedio poblacional pudo
surgir por la mera aleatoriedad de los datos?
Texto
¿La diferencia que observamos es estadı́sticamente significativa?
Pruebas de hipótesis/comparación/inferencia:
Rereferencias
25
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Razonamiento:
¿La muestra viene de una población con µ = 15 [ %]?
¿La diferencia entre nuestra media muestral y el promedio poblacional pudo
surgir por la mera aleatoriedad de los datos?
Texto
¿La diferencia que observamos es estadı́sticamente significativa?
Pruebas de hipótesis/comparación/inferencia:
Rereferencias
25
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Pruebas de hipótesis/comparación/inferencia:
Pruebas de hipótesis/comparación/inferencia:
Pruebas de hipótesis/comparación/inferencia:
Pruebas de hipótesis/comparación/inferencia:
Pruebas de hipótesis/comparación/inferencia:
Pruebas de hipótesis/comparación/inferencia:
x̄ − µ 14.7 − 15
Distribución t de Student: t= √ = √ = −2.646 (8)
s/ n 0.30/ 7
0.4
Texto
Función de densidad de probabilidad
0.3
0.2
0.1
0.0
x̄ − µ 14.7 − 15
Distribución t de Student: t= √ = √ = −2.646 (8)
s/ n 0.30/ 7
0.4
Texto
Función de densidad de probabilidad
0.3
0.2
0.1
0.0
x̄ − µ 14.7 − 15
Distribución t de Student: t= √ = √ = −2.646 (8)
s/ n 0.30/ 7
0.4
Texto
Función de densidad de probabilidad
0.3
0.2
0.1
0.0
x̄ − µ 14.7 − 15
Distribución t de Student: t= √ = √ = −2.646 (8)
s/ n 0.30/ 7
0.4
Texto
Función de densidad de probabilidad
0.3
0.2
0.1
0.0
Texto
Podemos mirar en tablas...
En R: pt(-2.646, df = 6)
En hojas de cálculo: =T.DIST(-2.646, 6, 1)
H1 : µ 6= 15 [ %] (10)
Las diferencias son importantes cuando son por déficit y cuando son por exceso.
Rereferencias
28
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Texto
Podemos mirar en tablas...
En R: pt(-2.646, df = 6)
En hojas de cálculo: =T.DIST(-2.646, 6, 1)
H1 : µ 6= 15 [ %] (10)
Las diferencias son importantes cuando son por déficit y cuando son por exceso.
Rereferencias
28
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Texto
Podemos mirar en tablas...
En R: pt(-2.646, df = 6)
En hojas de cálculo: =T.DIST(-2.646, 6, 1)
H1 : µ 6= 15 [ %] (10)
Las diferencias son importantes cuando son por déficit y cuando son por exceso.
Rereferencias
28
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Texto
Podemos mirar en tablas...
En R: pt(-2.646, df = 6)
En hojas de cálculo: =T.DIST(-2.646, 6, 1)
H1 : µ 6= 15 [ %] (10)
Las diferencias son importantes cuando son por déficit y cuando son por exceso.
Rereferencias
28
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
0.3
Texto 0.2
0.1
0.0
P(t(ν=6) < −2.646 || t(ν=6) > 2.646) = 2 × P(t(ν=6) < −2.646) = 0.0382 (12)
Rereferencias
29
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
0.3
Texto 0.2
0.1
0.0
P(t(ν=6) < −2.646 || t(ν=6) > 2.646) = 2 × P(t(ν=6) < −2.646) = 0.0382 (12)
Rereferencias
29
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
0.3
Texto 0.2
0.1
0.0
P(t(ν=6) < −2.646 || t(ν=6) > 2.646) = 2 × P(t(ν=6) < −2.646) = 0.0382 (12)
Rereferencias
29
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
H0 : µ = 15 [ %] H1 : µ 6= 15 [ %] (13)
Texto
¿O sea que 3.82 % es peque;o o es grande?
H0 es cierta H1 es cierta
Se acepta H0 Verdadero positivo Error tipo II: Falso negativo
Se rechaza H0 Error tipo I: Falso positivo Verdadero negativo
Rereferencias
30
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
H0 : µ = 15 [ %] H1 : µ 6= 15 [ %] (13)
Texto
¿O sea que 3.82 % es peque;o o es grande?
H0 es cierta H1 es cierta
Se acepta H0 Verdadero positivo Error tipo II: Falso negativo
Se rechaza H0 Error tipo I: Falso positivo Verdadero negativo
Rereferencias
30
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
H0 : µ = 15 [ %] H1 : µ 6= 15 [ %] (13)
Texto
¿O sea que 3.82 % es peque;o o es grande?
H0 es cierta H1 es cierta
Se acepta H0 Verdadero positivo Error tipo II: Falso negativo
Se rechaza H0 Error tipo I: Falso positivo Verdadero negativo
Rereferencias
30
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
H0 : µ = 15 [ %] H1 : µ 6= 15 [ %] (13)
Texto
¿O sea que 3.82 % es peque;o o es grande?
H0 es cierta H1 es cierta
Se acepta H0 Verdadero positivo Error tipo II: Falso negativo
Se rechaza H0 Error tipo I: Falso positivo Verdadero negativo
Rereferencias
30
Comparación de medias muestrales
Error tipo I y error tipo II
Error tipo I:
Rechazar la hipótesis nula cuando esta es cierta: falso positivo.
P(error tipo I) = α
Nivel de significancia. Lo definimos nosotros antes de recolectar datos.
Texto
Valores usuales son 0.05, 0.1 y 0.01.
Rereferencias
31
Comparación de medias muestrales
Error tipo I y error tipo II
Error tipo I:
Rechazar la hipótesis nula cuando esta es cierta: falso positivo.
P(error tipo I) = α
Nivel de significancia. Lo definimos nosotros antes de recolectar datos.
Texto
Valores usuales son 0.05, 0.1 y 0.01.
Rereferencias
31
Comparación de medias muestrales
Error tipo I y error tipo II
Error tipo I:
Rechazar la hipótesis nula cuando esta es cierta: falso positivo.
P(error tipo I) = α
Nivel de significancia. Lo definimos nosotros antes de recolectar datos.
Texto
Valores usuales son 0.05, 0.1 y 0.01.
Rereferencias
31
Comparación de medias muestrales
Error tipo I y error tipo II
µ1 = 3 µ2 = 7
FDP
Texto
µ1 = 3 µ2 = 7
FDP
En resumen...
Cuando el valor p es menor a la significancia de la prueba:
En resumen...
Cuando el valor p es menor a la significancia de la prueba:
En resumen...
Cuando el valor p es menor a la significancia de la prueba:
En resumen...
Cuando el valor p es menor a la significancia de la prueba:
Rereferencias
34
Comparación de medias muestrales
Media muestral contra valor de referencia: Fracción másica de potasio en un fertilizante
Rereferencias
34
Nivel de confianza
Nivel de confianza:
Es la probabilidad de que no se cometa un error tipo I.
Nidel de confianza = 1 − α
Texto (14)
Rereferencias
35
Nivel de confianza
Nivel de confianza:
Es la probabilidad de que no se cometa un error tipo I.
Nidel de confianza = 1 − α
Texto (14)
Rereferencias
35
Nivel de confianza
Nivel de confianza:
Es la probabilidad de que no se cometa un error tipo I.
Nidel de confianza = 1 − α
Texto (14)
Rereferencias
35
Aplicativo validaR
https://crparedes.shinyapps.io/validaR/
µ = 15 [ %]
XK2 O [ %]
Texto 14.4
14.7
15.2
14.3
14.7
14.7
14.9
Rereferencias
36
Aplicativo validaR
https://crparedes.shinyapps.io/validaR/
µ = 15 [ %]
XK2 O [ %]
Texto 14.4
14.7
15.2
14.3
14.7
14.7
14.9
Rereferencias
36
Comparaciones bilaterales y unilaterales
Pruebas de una cola y de dos colas
H0 : x̄ = µ H1 : x̄ < µ (15)
Texto
(No es importante si hay menos contaminante, nos importa solo si la muestra se pasa)
H0 : x̄ = µ H1 : x̄ > µ (16)
(No es importante si el rendimiento del nuevo proceso es menor, nos importa solo si mejora)
H0 : x̄ = µ H1 : x̄ < µ (15)
Texto
(No es importante si hay menos contaminante, nos importa solo si la muestra se pasa)
H0 : x̄ = µ H1 : x̄ > µ (16)
(No es importante si el rendimiento del nuevo proceso es menor, nos importa solo si mejora)
H0 : x̄ = µ H1 : x̄ < µ (15)
Texto
(No es importante si hay menos contaminante, nos importa solo si la muestra se pasa)
H0 : x̄ = µ H1 : x̄ > µ (16)
(No es importante si el rendimiento del nuevo proceso es menor, nos importa solo si mejora)
H0 : x̄ = µ H1 : x̄ < µ (15)
Texto
(No es importante si hay menos contaminante, nos importa solo si la muestra se pasa)
H0 : x̄ = µ H1 : x̄ > µ (16)
(No es importante si el rendimiento del nuevo proceso es menor, nos importa solo si mejora)
Rereferencias
38
Ejemplo práctico
Comparación de media muestral contra valor de referencia
Texto t=
x −y
q (18)
sx,y n1x + 1
ny
s
(nx − 1)sx2 + (ny − 1)sy2
sx,y = (19)
nx + ny − 2
ν =nx + ny − 2 (20)
Rereferencias
40
Comparación de medias muestrales independientes
Prueba t de Student para dos muestras independientes
Texto t=
x −y
q (18)
sx,y n1x + 1
ny
s
(nx − 1)sx2 + (ny − 1)sy2
sx,y = (19)
nx + ny − 2
ν =nx + ny − 2 (20)
Rereferencias
40
Comparación de medias muestrales independientes
Prueba t de Student para dos muestras independientes
Texto t=
x −y
q (18)
sx,y n1x + 1
ny
s
(nx − 1)sx2 + (ny − 1)sy2
sx,y = (19)
nx + ny − 2
ν =nx + ny − 2 (20)
Rereferencias
40
Comparación de medias muestrales independientes
Prueba t de Student para dos muestras independientes
Texto t=
x −y
q (18)
sx,y n1x + 1
ny
s
(nx − 1)sx2 + (ny − 1)sy2
sx,y = (19)
nx + ny − 2
ν =nx + ny − 2 (20)
Rereferencias
40
Comparación de medias muestrales independientes
Prueba t de Student para dos muestras independientes
x̄ contra una referencia µ:
x̄ − µ
t= √ (21)
s/ n
x̄ contra ȳ cuando los grupos son independientes y de varianzas diferentes:
Texto t =r
x −y
(22)
sx2 sy2
nx + ny
2
sx2 sy2
nx + ny
ν= 2 2 (23)
1 sx2 1 sy2
nx −1 nx + ny −1 ny
Rereferencias
41
Comparación de medias muestrales independientes
Prueba t de Student para dos muestras independientes
x̄ contra una referencia µ:
x̄ − µ
t= √ (21)
s/ n
x̄ contra ȳ cuando los grupos son independientes y de varianzas diferentes:
Texto t =r
x −y
(22)
sx2 sy2
nx + ny
2
sx2 sy2
nx + ny
ν= 2 2 (23)
1 sx2 1 sy2
nx −1 nx + ny −1 ny
Rereferencias
41
Ejemplo práctico
Comparación de dos medias muestrales independientes
Rereferencias
42
Ejemplo práctico
Comparación de dos medias muestrales independientes
Dos conjuntos están emparejados cuando los datos de uno guardan una relación
estrecha con los datos del otro.
Rereferencias
44
Comparación de medias muestrales de conjuntos emparejados
Dos conjuntos están emparejados cuando los datos de uno guardan una relación
estrecha con los datos del otro.
Rereferencias
44
Comparación de medias muestrales de conjuntos emparejados
Dos conjuntos están emparejados cuando los datos de uno guardan una relación
estrecha con los datos del otro.
Rereferencias
44
Comparación de medias muestrales de conjuntos emparejados
Dos conjuntos están emparejados cuando los datos de uno guardan una relación
estrecha con los datos del otro.
Rereferencias
44
Comparación de medias muestrales de conjuntos emparejados
Si las muestras estadı́sticas provienen de poblaciones con distribución normal las
diferencias entre cada pareja de datos Di = xi − yi tiene distribución t de Student
con grados de libertad ν = n − 1 donde n es el número de parejas:
D
t= √ (24)
Texto sD / n
H0 : D̄ = 0 H1 :D̄ 6= 0 (25)
Rereferencias
45
Comparación de medias muestrales de conjuntos emparejados
Si las muestras estadı́sticas provienen de poblaciones con distribución normal las
diferencias entre cada pareja de datos Di = xi − yi tiene distribución t de Student
con grados de libertad ν = n − 1 donde n es el número de parejas:
D
t= √ (24)
Texto sD / n
H0 : D̄ = 0 H1 :D̄ 6= 0 (25)
Rereferencias
45
Comparación de medias muestrales de conjuntos emparejados
Si las muestras estadı́sticas provienen de poblaciones con distribución normal las
diferencias entre cada pareja de datos Di = xi − yi tiene distribución t de Student
con grados de libertad ν = n − 1 donde n es el número de parejas:
D
t= √ (24)
Texto sD / n
H0 : D̄ = 0 H1 :D̄ 6= 0 (25)
Rereferencias
45
Ejemplo práctico
Comparación de dos medias muestrales de conjuntos emparejados
Texto 0.459
0.523
0.470
0.540
Tenemos muestras diferentes que se 0.644 0.664
miden por dos métodos distintos 0.845 0.889
(cada una). 0.421 0.444
0.839 0.846
0.867 0.871
Las mediciones están emparejadas. 0.696 0.708
0.677 0.689
Rereferencias
47
Ejemplo práctico
Comparación de dos medias muestrales de conjuntos emparejados
Rereferencias
48
Comparación de métodos analı́ticos
Regresión lineal
Rereferencias
49
Comparación entre varias medias muestrales...
Primero tenemos que ver otros temas
TALLER V IRTUAL
ESTADÍSTICA
APLICADA AL
LABORATORIO
Introducción a la inferencia
estadı́stica
Cristhian Paredes