Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Contraste de significación
(proceso en el que se aplica una prueba estadística)
CONTRASTES DE SIGNIFICACIÓN
Se trata de una prueba estadística que evalúa si la diferencia observada entre
un descriptor muestral (“ x“ o “s”) con un valor de referencia o con otro/s
descriptor/es muestrales (“ x“ o “s”) es significativa. Para ello, se establece una
hipótesis de partida (hipótesis nula, Ho) y se prueba la veracidad de dicha
hipótesis
La Ho establece que los valores comparados son iguales y que las
únicas diferencias que se observan entre ellos son debidas al azar
Paso 1 Establecer Ho
Para estar aún más seguro de que estamos tomamos la decisión adecuada, se
puede utilizar un nivel de significación más pequeño, 1% ( = 0.01) o 0.1% ( =
0.001)
El nivel de significación ()
Nivel de significación: 5%
Nivel de Nivel de
confianza (P ) significación (α)
Nivel de confianza: 95%
Paso 4 Comparar el parámetro estadístico calculado con el correspondiente
al nivel de significación establecido (VALOR CRÍTICO/TABULADO)
Se mantiene la Se rechaza la
hipótesis nula hipótesis nula
Se acepta Se rechaza Ho
Ho
Nivel de Nivel de
confianza significación (α)
Valor crítico
(tabulado)
Rechazar la hipótesis nula es aseverar que la hipótesis no es cierta,
es decir, que hay errores sistemáticos
ACEPTO Ho RECHAZO Ho
Ho: x = μ
Error
tipo I o error
x cri
ACEPTO: error tipo II
Ho falsa
RECHAZO: no hay error
Error tipo II (error ß): es el error que se produce al mantener una Ho aún
siendo falsa y rechazar una H1 siendo verdadera.
H1: x ≠ μ
RECHAZO Ho
ACEPTO Ho
ACEPTO H1
Existe interdependencia
entre los errores tipo I y
II
μ x cri μ*
La única forma de disminuir
ambos errores es aumentar el
tamaño de la muestra
Al aumentar el número de
datos, la desviación estándar
de la media disminuirá y la
campana se hará más
pequeña, es decir, los datos
estarán más concentrados
alrededor del valor central
disminuyendo ambos errores
Contrastes de una cola y dos colas
Las pruebas estadísticas pueden contrastar dos cosas sin tener una idea
preconcebida de si la diferencia entre ellas es positiva o negativa o si es en
cualquier dirección.
Ho H1
Una cola x1 = x2 x1 < o > x2
Dos colas x1 = x2 x1 ≠ x2
Ejemplo
Con los datos citados anteriormente, determinar la pureza del lote de Na2CO3
Contrastes de significación
Tipos
- Comparación de una
media con un valor
conocido Comparación de
datos pareados
- Comparación de dos
medias
test-t
CONTRASTES PARA DETECTAR DATOS ANÓMALOS
En el trabajo analítico es muy frecuente que uno o más resultados que se
obtienen de un conjunto de medidas difiera del resto de forma
inexplicable.
Procedimiento
1. Se establece la hipótesis nula:
Ivalor
valorsospecho valor sospechoso
cercano – más cercano I x 2 x1
Q3 / 7
(valor más grande valor más pequeño) x n x1
x 2 x1 x x1 x3 x1
Q8 / 10 Q11 / 13 3 Q14 / 30
x n 1 x1 x n 1 x1 x n 2 x1
3. Se establece un “Qcri” ó “Qtab” para un nivel de significación o probabilidad
dado y para un tamaño de muestra “n”.
2. Prueba estadística
valor sospecho valor más cercano 0.380 0.401
Qcal 0.7
(valor más grande valor más pequeño) (0.410 0.380)
3. Para un nivel de significación de 0.05, el Q4= 0.831
4. Comparación Qest con Q4: como Qcal < 0.831, se acepta la hipótesis nula y no
se puede rechazar el valor anómalo.
Si se incluyen los siguientes datos: 0.400, 0.413 y 0.411, la nueva Qcal = 0.606
que es mayor que el Qtab = 0.570 y ahora si se puede rechazar el dato anómalo.
Ejemplo 2
Determinar si alguno de los siguientes datos es rechazable:
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12
4.3 5.7 5.9 6.0 6.0 6.4 6.6 6.8 7.1 7.2 8.4 9.7
2. Prueba estadística
x3 x1
Q11 / 13
x n 1 x1
¿Cuándo se utiliza?
Este contraste estadístico permite estimar si un dato anómalo es rechazable.
Recomendado por ISO.
Procedimiento
valor sospechoso x
G
s
3. Se establece un “Gtab” para un nivel de significación dado.
4. Se compara el valor estimado de “G” con “Gtab”. Si el parámetro estimado
supera ese “Gtab” la Ho se rechaza y es posible rechazar el valor sospechoso.
Ejemplo 1
Se obtuvieron los siguientes valores para la concentración de nitrito (mg/L) en
una muestra de agua de río:
2. Prueba estadística
valor sospechoso x
G = (0.403 – 0.380)/0.0112 = 2.02
s
4. Comparación Gcal con G7: Gcal > 1.94, la hipótesis nula no se cumple y se
puede rechazar el dato anómalo.
CONTRATE PARA LA COMPARACIÓN DE VARIANZAS
¿Cuándo se utiliza?
- Para comparar las varianzas de dos métodos, condiciones, muestras, etc.
distintos.
Procedimiento
1. Se establece la hipótesis nula: Ho: s12 = s22
2. Se aplica la prueba estadística correspondiente en este caso para calcular
el estadístico “F”
s12
F 2 F≥1
s2
3. Se establece un “Fcri” para un nivel de significación o probabilidad dado y
“n1-1” grados de libertad del numerador y “n2 -1” grados de libertad del
denominador.
2. Prueba estadística
¿Cuándo se utiliza?
Requisito
Los programa estadísticos permiten también hacer este cálculo pero en vez de
estimar un “t” que comparan con un “tcri” de las tablas, lo que hacen es dar la
probabilidad (p-valor) de que el “tcri” sea mayor al ”t “ calculado. Si esa
probabilidad es grande, Ho se cumple pero si la probabilidad es inferior al nivel
de significación () establecido, entonces, la Ho se tiene que rechazar.
Ejemplo 4
En un nuevo método para determinar selenourea en agua, se obtuvieron los
siguientes valores para muestras de agua de grifo adicionadas con 50 ng/mL de
selenourea:
Como tcal < 2.78, se acepta la hipótesis nula para un nivel de significación de 0.05
(se asume un riesgo del 5% de que estemos rechazando la Ho siendo cierta).
tcal< ttab
ttab p-valor p-valor > α
tcal α
x
ZONA
ZONA SE RECHAZA Ho
RECHAZO
ACEPTACIÓN
tcal > ttab
x
Resolución del ejemplo 4 con Statgraphics
(descripción datos numéricos análisis de una variable)
Tamaño de muestra = 5
Media = 50.06
Desviación típica = 0.95551
contraste t
-----------
Hipótesis nula: media = 50.0
Alternativa: no igual
Estadístico t = 0.140411
p-valor = 0.895122
4. Comparación tcal con t5: como tcal > 2.02, se rechaza la hipótesis nula.
El método de valoración muestra un error sistemático
Resolución del ejemplo 5 con Statgraphics
(descripción datos numéricos análisis de una variable)
Tamaño de muestra = 6
Media = 25.2283
Desviación típica = 0.238279
contraste t
-----------
Hipótesis nula: media = 25.0 Cambiar en
Alternativa: mayor que (H1: ẋ > µ) “Opciones de ventana”
Estadístico t = 2.34725
p-valor = 0.0328925
¿Cuándo se utiliza?
- Comparar si los resultados que se obtienen cuando una misma
muestra se analiza por dos métodos diferentes, dos analistas
diferentes, etc. coinciden estadísticamente (solo se varía una
variable)
- Comparación de dos métodos analíticos diferentes
- Comparación de nuestro método analítico con uno de referencia
- Comparación de nuestro método analítico con uno oficial
- Comparación de dos muestras distintas analizadas con un mismo
método
Requisitos
s21 ≠ s22
s2 1 = s2 2
( x1 x2 ) ( x1 x2 ) Test de
t t Cochran
1 1 s12 s22
s
n1 n2 n1 n2
s2 s2 2
(n1 1) s (n2 1) s
2 2
( 1 2)
s2 1 2 n
1
n
2
(n1 n2 2) grados libertad
s 4 s4
( 1 2 )
Grados libertad “t”: n1 + n2 -2 n 2 ( n 1) n 2 (n 1)
1 1 2 2
Hay que hacer un test “t” para comprar las medias. Para elegir el test “t” adecuado, hay que
comparar previamente las varianzas de ambos métodos utilizar un test F
30 min x
̅ 1 = 57.00 s1 = 2.80
2 Ho: σ2 = σ2 1 2 2.80
1 2 FCAL 2 1.09
75 min x̅ 2 = 57.83 s22 = 2.57 H1: σ21 ≠ σ22 2 2.57
4. Comparación tcal con tcrit: como 0.88 < 2.23, se acepta la hipótesis nula.
sano x
̅ 1 = 1.92 s21= 0.006
reumatoide x
̅ 2 = 3.46 s22= 0.194
Test-F
1 2 0.194
Ho: σ2 1 = σ2 2 FCAL 2 32
2 0 .006
H1: σ21 ≠ σ22
Para un nivel de significación dado de 0.05 (contraste de dos cola) y 5 grados de
libertad en el numerador y 6 en el denominador, Ftab= 5.99
Como el Fcal > Ftab, se rechaza la hipótesis nula, las varianzas son diferentes!!!!
Test-t
s2 s2 2
( 1 2)
( x1 x 2 ) (1.921 3.465) n
1
n
2
t cal 8.48 grados libertad
4 4
5.3
s s
s 2
s 2
0.0057 0.1940 1 2
1 2 (
2 2
n ( n 1) n (n 1)
)
n1 n 2 7 6 1 1 2 2
4. Comparación tcal con t5: como tcal > 2.57, se rechaza la hipótesis nula.
Requisitos
d1 d2 d3 d4
d n
t
sd
3. Se establece un “tcri” o “ttab” para un nivel de significación o probabilidad
dado y “n-1” grados de libertad.
4. Se compara el valor estimado del estadístico “t” con el “tcri” Si el parámetro
estimado no supera ese “tcri” entonces la Ho no se rechaza.
Ejemplo 8
Se quiere comparar si un fármaco produce un descenso de Fe(III) en sangre.
Para ello, se determina el contenido en Fe antes y después del tratamiento sobre
una muestra de 6 individuos:
4. Comparación tcal con t5: como tcal > 2.02, se rechaza la hipótesis nula.
El fármaco disminuye el contenido de Fe (III) en sangre
Resolución del ejemplo 8 con Statgraphics
(comparar dos muestras muestras pareadas)
Tamaño de muestra = 6
Media = -0.365 Media de las diferencias
Varianza = 0.11063
Desviación típica = 0.332611
contraste t
-----------
Hipótesis nula: media de las diferencias = 0.0
Alternativa: mayor que Cambiar en
“Opciones de ventana”
Estadístico t = -2.68802
p-valor = 0.0217
SE RECHAZA LA Ho
SE ACEPTA H1
ANOVA (ANÁLISIS DE LA VARIANZA) PARA LA
COMPARACIÓN DE VARIAS MEDIAS
¿Cuándo se utiliza?
permite comprobar si dos medias
Test-t
difieren significativamente
Análisis de la Varianza
permite comprobar si muchas medias
(ANOVA)
difieren significativamente
Ejem.
-
Grupo 1: X11 X12 X13 X14 X15 X1 s1
-
Grupo 2: X21 X22 X23 X24 X25 X2 s2
-
Grupo 3: X31 X32 X33 X34 X35 X3 s3
-
Grupo 4: X41 X42 X43 X44 X45 X4 s4
-
Grupo 5: X51 X52 X53 X54 X55 X5 s5
……….
Errores
aleatorios de la Factor controlado
medida o de efecto fijo
- condiciones de almacenamiento
- método de análisis
- operadores
- un factor controlado
- un factor de efecto aleatorio
1. Ho: todas las varianzas son iguales (σ21 = σ22 = σ23 =………)
H1: al menos dos varianzas son diferentes
2. Prueba estadística
si = varianza de los datos o laboratorio “i” con “ni” determinaciones y “ni – 1” grados de
libertad.
N = número total de datos
k = número de series
Sp = varianza promedio
Ensayo de homogeneidad de Levene
1. Ho: todas las varianzas son iguales (σ21 = σ22 = σ23 =………)
H1: al menos dos varianzas son diferentes
2. Prueba estadística
(diferencia entre cada dato de
una serie y su mediana)
Señal
muestras 95 C D
D
90 D
85
0 1 2 3 4
Condiciones
CASO GENERAL
Procedimiento
1. Establecer la Ho y la H1:
( xij xi ) 2
Expresión utilizada para determinar la
oi 2 j
varianza dentro de cada muestra
(n 1)
oi 2 Expresión utilizada para calcular la
odm
2 i varianza promedio dentro de muestras
h
SUMA DE CUADRADOS
( xij x i ) 2
DENTRO DE MUESTRAS
2
dm
0
i j h (n 1) Grados de libertad: h (n -1)
SUMA DE CUADRADOS
( x i x) 2
n
2 ENTRE MUESTRAS
0em
i (h 1) Grados de libertad: h -1
98
SSem =
SSdm =
SST =
𝒆𝒏𝒕𝒓𝒆 𝒎𝒖𝒆𝒔𝒕𝒓𝒂𝒔
𝒅𝒆𝒏𝒕𝒓𝒐 𝒅𝒆 𝒎𝒖𝒆𝒔𝒕𝒓𝒂𝒔
Fcal = 62 / 3 = 20.7
Colocar las medias en orden creciente y comparar la diferencia entre los valores
adyacentes con una cantidad llamada mínima diferencia significativa
n: número de medidas
realizadas para cada muestra ( x1 x2 )
t
Esta expresión procede de esta otra 1 1
para determinar si hay diferencia s
significativa entre dos medias n1 n2
En nuestro ejemplo:
5 4 1
x D 92 x C 97 x A 101 x B 102
Raíz cuadrada de la
varianza dentro muestras
2 2
s x t h ( n 1) 3 x x t8 (2.31) 3.26
n 3 2 colas!!!
Condiciones Medidas repetidas Media
A: preparada recientemente 102, 100, 101 101
B: almacenada 1 h en la oscuridad 101, 101, 104 102
C: almacenada 1 h con luz tenue 97, 95, 99 97
D: almacenada 1 h con luz brillante 90, 92, 94 92