Está en la página 1de 42

Análisis estadístico de datos de

evaluación sensorial
Pruebas discriminativas
Análisis de Varianza
Supuestos
• La variable dependiente debe medirse al menos en
escala de intervalo.
• Independencia de las observaciones.
• La distribución de los residuales debe ser normal.
• Homogeneidad de las varianzas (homocedasticidad).

Si no se cumplen los supuestos???


Alternativas: transformar datos o estadística no
paramétrica.
Estadística no paramétrica
• En evaluación sensorial, las calificaciones realmente se
toman es escala ordinal, realmente no se producen
calificaciones continuas, no hay intervalos claros y
continuos. Excepto en pruebas de consumidores,
donde el número de panelistas es alto.

• Estadísticas no paramétricas:
– Menos potencia (capacidad de rechazar Ho cuando
realmente es falsa), pero son menos estrictas en los
supuestos.
– No se necesita conocer la distribución, ni normalizarse.
Tipo de pruebas no parámetricas

El tipo de prueba:
En función del número de muestras
Si las muestras están o no relacionadas
Dos muestras independientes (vienen de dos
poblaciones diferentes)

– P. de ManWhitney
– P. Z de Kolmogorov-Smirnov
– P. de rachas de Wald-Wolfowitz
– P. de contrates
– P. de reacciones extremas de Moses
Dos muestras relacionadas (pareadas, por ej. la misma muestra
en tiempos diferentes)

– P. de Wilcoxon
– P. de los signos
K muestras independientes (vienen de
poblaciones diferentes)
• P. de Kruskal-Wallis
• P. de la mediana
• P. de Jonckheere-Terpstra
K muestras relacionadas (por ejemplo: la
misma muestra en tiempos diferentes)
• P. de Friedman
• P. de Kendal
• P. de Cochran
Dos muestras independientes
Prueba de MannWhitney
Ejemplo: Puntaje Puntaje
Panelista M1 M2
1 6 8
2 6 7
3 4 6
4 4 5
5 8 6
6 2 5
7 4 5
8 3 6
Establecer los rangos de orden
Puntajes de M1 y Puntajes ordenados de menor a
M2 No de orden mayor Rangos de orden
6 1 2 1
2 2 3 2
3 3 4 4
4 4 4 4
4 5 4 4
4 6 5 7
5 7 5 7
5 8 5 7
5 9 6 11
6 10 6 11
6 11 6 11
6 12 6 11
6 13 6 11
7 14 7 14
8 15 8 15,5
8 16 8 15,5
Se reemplazan los puntajes originales
por los rangos de orden
M1 M2 R1 R2
6 8 11 15,5
6 7 11 14
4 6 4 11
4 5 4 7
8 6 15,5 11
2 5 1 7
4 5 4 7
3 6 2 11

Suma 52,5 83,5


R Promedio 6,56 10,44
Prueba de Mann Whitney
n1(n1+1)
U1= n1n2+ – σ 𝑅1
2

8(8+1)
U1= 8*8+ – 52,5
2

U1= 47,5

n2(n2+1)
U2= n1n2+ – σ 𝑅2
2

8(8+1)
U2= 8*8+ 2
– 83,5

U2= 16,5

U de ManWhitney: el mayor de 47,5 y 16,5


U calculado: 47,5
U tablas: 13

Si U calculado > U tablas: acepto Ho


Si U calculado ≤ U tablas: rechazo Ho (Es al
contrario que las otras pruebas)
En Statgraphics
Dos muestras relacionadas
Prueba de los signos
Catador M1 M2 Diferencia
1 9 7 2
2 8 6 2
3 7 5 2
4 6 3 3
5 6 6 0
6 8 4 4
7 7 6 1
8 5 6 -1

n= 7 (no cuentan los empates)


(+)s = 6
(-)s = 1
Ho: La mediana de la diferencia= 0
Se calcula el p valor, Si Ho es cierto, qué tan probable es obtener 6(+)s ó 7(+)s de 7 juicios?

𝑛 𝑥 𝑛−𝑥
p 𝑋=𝑥 = 𝑝 1−𝑝
𝑥

7
p= 0,56 1 − 0,5 7−6
6

7!
p= 0,56 (1 − 0,5)1
6! 7−6 !

p= 0,05469, la probabilidad de obtener 6 (+)s.


Más la probabilidad de obtener 7(+)s

7 7!
0,57 1 − 0,5 7−7 = 0,57 (1 − 0,5)0 = 1 ∗ 0,57 * 1 = 0,0078
7 7! 7−7 !
• Probabilidad de obtener 6(+)s + prob de
obtener 7 (+)s = 0,05469 + 0,0078 = 0,0625

• Si Ha es de una cola: este es el p valor


• Si Ha es de dos colas: p valor= 0,0625*2 =
0,125
Se acepta la 𝐻𝑜
En Statgraphics
Dos muestras relacionadas (pareadas)
Prueba de Wilcoxon
Ejemplo M1 M2
9 6
7 5
8 6
6 7
9 8
8 7
9 6

8 6 Mediana
Prueba de Wilcoxon

M1 M2 Diferencia |Diferencia|
9 6 3 3
7 5 2 2
8 6 2 2
6 7 -1 1
9 8 1 1
8 7 1 1
9 6 3 3
Se rankea el valor absoluto de las diferencias.

No de orden |Diferencia| Rangos de orden


1 1 2
2 1 2
3 1 2
4 2 4,5
5 2 4,5
6 3 6,5
7 3 6,5
Se reemplazan los valores de las
diferencias por sus rangos de orden
Rango con
M1 M2 Diferencia |Diferencia| Rango sin signo signo
9 6 3 3 6,5 6,5
7 5 2 2 4,5 4,5
8 6 2 2 4,5 4,5
6 7 -1 1 2 -2
9 8 1 1 2 2
8 7 1 1 2 2
9 6 3 3 6,5 6,5
T(+)= Sumatoria de R (+)s: 26
T(-)= Sumatoria de R (-)s: 2
T calculado min(T+,T-)= 2
n=7
Vamos a la tabla de Wilcoxon
• T calculado : 2
• T tablas: 2

• Si T calculado es < T tablas: se acepta Ho


• Si T calculado es ≥T tablas: se rechaza Ho
Wilcoxon en Statgraphics
Tres o más muestras independientes
Prueba de Kruskal Wallis
Panelista M1 M2 M3
1 5 2 5
2 7 3 6
3 8 5 7
4 6 2 6
5 9 2 8
6 9 4 8
7 8 1 9

k= 3 (muestras)
n= 7 (repeticiones)
N= n x k = 21
Se
mezclan No de Datos Rangos de
los datos orden ordenados orden
5 1 1 1
7 2 2 3
8 3 2 3
6 4 2 3
9 5 3 5
9 6 4 6
8 7 5 8
2 8 5 8
3 9 5 8
5 10 6 11
2 11 6 11
2 12 6 11
4 13 7 13,5
1 14 7 13,5
5 15 8 16,5
6 16 8 16,5
7 17 8 16,5
6 18 8 16,5
8 19 9 20
8 20 9 20
9 21 9 20
Se reemplazan los puntajes originales
por los rangos de orden
M1 M2 M3 r1 r3 R3
5 2 5 8 3 8
7 3 6 13,5 5 11
8 5 7 16,5 8 13,5
6 2 6 11 3 11
9 2 8 20 3 16,5
9 4 8 20 6 16,5
8 1 9 16,5 1 20
SUMA 105,5 29 96,5
Rango promedio 15,07 4,14 13,78
k= 3 (muestras)
n= 7 (repeticiones)
N= n x k = 21
𝑘
12 𝑅𝑗 2
𝑄= ∗ ෍ − 3(𝑁 + 1)
𝑁(𝑁 + 1) 𝑛𝑗
1

12 105,52 292 96,52


𝑄= ∗ + + − 3(21 + 1)
21 21 + 1 7 7 7

Q = 12,97

• Vamos a la tabla Chi2


X2 (0.05,k-1)
X2(0.05,2) = 5.99
Si Q calculado < X2 se acepta Ho
Si Q calculado ≥ X2 se rechaza Ho
O se calcula el valor p (Q ≥12,97;2)= 0,0014
Kruskal-Wallis en Statgraphics
DMS
t student (α, N-k)

t (0,05; 18)= 2,101

N(N+1)
𝑆2 =
12
21(21+1)
𝑆2 = = 38,5
12

1 1
N−1−Q 2 1 1 2
DMS= t (α, N-k) * 𝑆 2 * +
N−K 𝑛𝑖 𝑛𝑗

1 1
21−1−12,97 2 1 1 2
DMS= 2,101 * 38,5 * +
21−3 7 7

DMS= 4,35
Comparaciones múltiples
Rango promedio 1- rango promedio 2
| 15,07-4,14 |= 10,93 > 4,35 ; M1≠M2

Rango promedio 2- rango promedio 3


| 15,07-13,78 |= 1,29 < 4,35 ; M1=M3

Rango promedio 2- rango promedio 3


| 4,14-13,78 |= 9,64 > 4,35 ; M2≠M3
Tres o más muestras relacionadas
Prueba de Friedman
catador t1 t2 t3 t4
1 9 8 6 5
2 7 6 6 4
3 8 5 5 6
4 9 9 6 3
5 8 6 5 7
6 9 8 6 4
7 8 8 5 3
8 9 7 5 2
Rangos de orden
(Se rankea fila por fila)
catador T1 t2 t3 t4 R1 R2 R3 R4
1 9 8 6 5 4 3 2 1
2 7 6 6 4 4 2,5 2,5 1
3 8 5 5 6 4 1,5 1,5 3
4 9 9 6 3 3,5 3,5 2 1
5 8 6 5 7 4 2 1 3
6 9 8 6 4 4 3 2 1
7 8 8 5 3 3,5 3,5 2 1
8 9 7 5 2 4 3 2 1
SUMA 31 22 15 12

Rango de orden
promedio 3,87 2,75 1,87 1,50

n=8
k= 4
n(k+1) 8(4+1)
m= = = 20
2 2
2
12 2
𝑥 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = ෍ 𝑟𝑖 − 𝑚
𝑛(𝑘)(𝑘 + 1)

𝑥 2 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜
12 2 2 2 2
= 31 − 20 + 22 − 20 + 15 − 20 + 12 − 20
8∗4∗ 4+1

𝑥 2 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 16,05
X2 tablas (k-1, α)
X2 tablas (3-1, 0,05)= 7,815

Si 𝑥 2 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 < X2 tablas acepto Ho


Si 𝑥 2 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 ≥ X2 tablas rechazo Ho
16,05> 7,815 se rechaza Ho

O se calcula el valor p
P(𝑥 2 ≥ 16,15) con 3 GL = 0,00105
Al menos un tratamiento es diferente. Pero Cuál?
DMS

2
𝐴2 = σ 𝑅𝑖𝑗 = 42 + 42 + ….+ 12 +12 = 238

1 2 1
𝐵2 = 𝑛 σ 𝑅𝑖. = 8 312 + 222 + 152 + 122 = 226,75

t (α, (n-1)(k-1))

t (0,05), (7)(3)) = 2,0796


2𝑛(𝐴2 −𝐵2 ) 1/2
DMS = t 0,05, (𝑛 − 1 (𝑘 − 1))
(𝑛−1)(𝑘−1)

2∗8(238 −226,75) 1/2


DMS = 2,0796 = 6,1
(8−1)(4−1)

Comparaciones múltiples
|Suma de rangos 1 – Suma de rangos 2 | -vs- DMS

|31-22| = 9 9> 6,1 ; M1 ≠ M2


|31-15| = 16 16> 6,1 ; M1 ≠ M3
|31- 12 = 19 19> 6,1 ; M1 ≠ M4
|15-12| = 3 3< 6,1 ; M3 = M4
Friedman en Statgraphics

También podría gustarte