Está en la página 1de 8

ANEXO A

HERRAMIENTAS ESTADISTICAS1
Herramienta
Uso de la herramienta estadística Criterio de aceptación o rechazo
estadística
Regla que especifica si se puede aceptar o rechazar una afirmación acerca de una población dependiendo de la 𝑝 ≤ 𝛼 Los resultados son estadísticamente significativos y se rechaza
evidencia proporcionada por una muestra de datos a partir de establecer una hipótesis nula y una hipótesis la hipótesis nula 𝐻0 .
alternativa. 𝑝 > 𝛼 Los resultados no son estadísticamente significativos y se
Pruebas de
Hipótesis nula 𝑯𝟎 Enunciado relativo al valor de un parámetro poblacional (la media, la desviación estándar, acepta la hipótesis nula 𝐻0 .
hipótesis
etc.) formulado con el fin de probar que es igual a un valor hipotético. Donde el valor p es una probabilidad que mide la evidencia en contra
Hipótesis alternativa 𝑯𝟏 Afirmación que se aceptará si los datos muéstrales proporcionan suficiente evidencia de la hipótesis nula 𝐻0 y el nivel de significancia α indica el riesgo de
de que la hipótesis nula H0 es falsa. concluir que existe una diferencia cuando no hay una diferencia real.
Se utiliza, por ejemplo, para determinar igualdad entre las varianzas de dos poblaciones normales cuando la
dócima estadística usada se basa en las varianzas de dos muestras independientes; La hipótesis nula se rechaza si 𝐹 < 𝐹𝑐𝑟𝑖𝑡
Hipótesis nula 𝑯𝟎 : Las varianzas son iguales. donde:
Prueba F de
Fisher Hipótesis alternativa 𝑯𝟏 : Las varianzas no son iguales. 𝐹𝑐𝑟𝑖𝑡 es el valor crítico de la función de distribución 𝐹 para una prueba
de dos colas;
𝑭 𝑠1 2
𝐹= 2 𝑛1 − 1 y 𝑛2 − 1 son los grados de libertad; y
𝑠2
𝛼 es el nivel de significancia para una prueba de dos colas.
donde 𝑠1 > 𝑠2 .
2 2

Se utiliza para comprobar si los datos satisfacen el supuesto de normalidad para una prueba 𝑡. Esta prueba resulta
mucho más adecuada para muestras superiores a 30 observaciones.
Hipótesis nula 𝑯𝟎 : Los datos provienen de una población normalmente distribuida.
Prueba de
normalidad Hipótesis alternativa 𝑯𝟏 : Los datos no provienen de una población normalmente distribuida.
de 𝐴2 = −𝑁 − 𝑆
Anderson- La hipótesis nula se rechaza si 𝐴2 > 𝐴2 𝑐𝑟𝑖𝑡
donde:
Darling
𝐴2 es el área entre la línea de ajustada basada en la distribución elegida y la función de paso no paramétrica,
𝑨𝟐 basado en los puntos de la gráfica;
𝑁 es el número de datos; y
𝑆 es la desviación estándar.
Prueba de Se utiliza para contrastar normalidad cuando el tamaño de la muestra es menor a 50 observaciones. En muestras
normalidad grandes es equivalente al test de Kolmogórov-Smirnov.
de Shapiro- La hipótesis nula se rechaza si 𝑊 < 𝑊𝑐𝑟𝑖𝑡
Wilks Hipótesis nula 𝑯𝟎 : Los datos provienen de una población normalmente distribuida.
𝑾 Hipótesis alternativa 𝑯𝟏 : Los datos no provienen de una población normalmente distribuida.

1 NIST/SEMATECH e-Handbook of Statistical Methods, http://www.itl.nist.gov/div898/handbook/, date. (https://doi.org/10.18434/M32189)


∑𝑛𝑖=1 𝑎𝑖 × 𝑌𝑖2
𝑊=
∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)2
donde 𝑎𝑖 son los coeficientes tabulados en la tabla de Shapiro.
Se utiliza, por ejemplo, para determinar:
a) igualdad entre la media de una población normal y un valor especificado cuando la dócima estadística se basa a) La hipótesis nula se rechaza si 𝑡 > 𝑡𝑐𝑟𝑖𝑡 .
en el promedio de la muestra y en la varianza de la muestra;
Hipótesis nula 𝑯𝟎 : La media es igual al valor especificado.
Hipótesis alternativa 𝑯𝟏 : La media no es igual al valor especificado.
Prueba t de 𝑥̅ − 𝜇0
𝑡=
Student 𝑠 ⁄ √𝑛
𝒕 b) igualdad entre las medias de dos poblaciones normales cuando la dócima estadística se basa en los promedios b) La hipótesis nula se rechaza si 𝑡 > 𝑡𝑐𝑟𝑖𝑡 .
y las varianzas de dos muestras independientes.
Hipótesis nula 𝑯𝟎 : Las medias son iguales.
Hipótesis alternativa 𝑯𝟏 : Las medias no son iguales.
𝑥̅1 − 𝑥̅2
𝑡=
√𝑠1 2 ⁄𝑛1 + 𝑠2 2 ⁄𝑛2
Se utiliza, por ejemplo, para determinar la igualdad entre la varianza de una población normal y un valor
especificado cuando la dócima estadística se basa en la varianza de la muestra.
Hipótesis nula 𝑯𝟎 : Las varianzas son iguales.
Prueba Chi- Hipótesis alternativa 𝑯𝟏 : Las varianzas no son iguales.
Cuadrado (𝑂𝑖 − 𝐸𝑖 )2 La hipótesis nula se rechaza si 𝜒 2 > 𝜒1−𝛼,𝜈
2
.
𝜒2 = ∑
𝝌𝟐 𝐸𝑖
donde:
𝑂𝑖 es la frecuencia observada; y
𝐸𝑖 es la frecuencia esperada.
Se utiliza para determinar el mayor y el menor valor atípico de una serie de mediciones, por lo que la prueba no
debe realizarse más de una vez a la misma serie de mediciones.
Hipótesis nula 𝑯𝟎 : El valor máximo no es un valor atípico.
Hipótesis alternativa 𝑯𝟏 : El valor máximo es un valor atípico.
Prueba de 𝑥𝑖+1 − 𝑥1 𝑥𝑛 − 𝑥𝑛−1
Dixon 𝑄𝑖𝑗 = 𝑄𝑖𝑗 = La hipótesis nula se rechaza si 𝑄𝑖𝑗 > 𝑄𝑖𝑗 𝑐𝑟𝑖𝑡 .
𝑥𝑛−𝑗 − 𝑥1 𝑥𝑛 − 𝑥𝑗+1
𝑸𝒊𝒋
donde:
▪ i indica el número de valores extremos en el mismo lado (inferior o superior) de los datos que el supuesto valor
atípico 𝑖 = 1 𝑜 2
▪ j indica el número de valores extremos en el lado opuesto de los datos 𝑗 = 0, 1 𝑜 2
Permite determinar la recta que minimiza la dispersión a partir de hacer mínima la suma de las diferencias al La recta de interpolación es adecuada si:
cuadrado entre los valores observados y los correspondientes valores ajustados.
𝑟 ≥ 0,999 Coeficiente de correlación
𝑦′ = 𝑏 + 𝑚 × 𝑥
Regresión 𝑅2 ≥ 0,995 Coeficiente de determinación
lineal por donde:
donde:
mínimos ∑ 𝑥 × ∑(𝑥 × 𝑦) − ∑ 𝑦 × ∑ 𝑥 2
𝑏= ∑𝑥 × ∑𝑦
cuadrados (∑ 𝑥)2 − 𝑛 × ∑ 𝑥 2 ∑(𝑥 × 𝑦) −
𝑟= 𝑛
∑ 𝑥 × ∑ 𝑦 − 𝑛 × ∑(𝑥 × 𝑦)
𝑚= √[∑ 𝑥 2 − × (∑ 𝑥)2 ] × [∑ 𝑦 2 − 1 × (∑ 𝑦)2 ]
1
(∑ 𝑥)2 − 𝑛 × ∑ 𝑥 2 𝑛 𝑛
Se utiliza, por ejemplo, para determinar:
▪ qué tanto de la variabilidad en el sistema de medición es causada por el dispositivo de medición (Repetibilidad);
▪ qué tanto de la variabilidad en el sistema de medición es causada por las diferencias entre los operadores
(Reproducibilidad);
▪ si la variabilidad del sistema de medición es pequeña en comparación con la variabilidad del proceso; y
𝑟 < 0.1 × 𝑅 Reproducibilidad aceptable, compatibilidad entre las
▪ si el sistema de medición es capaz de distinguir entre partes diferentes. diferentes condiciones evaluadas.
Estudios
𝑝 𝑛 0.1 × 𝑅 ≤ 𝑟 ≤ 0.3 × 𝑅 Reproducibilidad aceptable, debe mejorarse
1 2
1 en base a la importancia del método, costo de los equipos, costo del
r&R 𝑠𝑟 = √ × ∑ 𝑠𝐿,𝑖 𝑠𝐿,𝑖 = √ × ∑(𝑥𝑘 − 𝑥̅𝑖 )2
𝑝
𝑖=1
𝑛−1
𝑘=1
servicio, etc.
𝑟 > 0.3 × 𝑅 Reproducibilidad no aceptable. Se debe mejorar el
𝑟 = 2,8 × 𝑠𝑟 sistema de medición (personal, equipo, métodos, condiciones).
𝑝
1 𝑛−1
𝑠𝑅 = √ × ∑(𝑥̅𝑖 − 𝑥̿ )2 + × 𝑠𝑟2
𝑝−1 𝑛
𝑖=1

𝑅 = 2,8 × 𝑠𝑅
Se utiliza si se cumplen las siguientes condiciones:
▪ 𝑆1 > 𝑆2 donde, 𝑆1 es la desviación obtenida de las mediciones y 𝑆2 es la desviación del valor asignado o de
referencia;
▪ 𝐹1 ≤ 𝐹𝑐𝑟𝑖𝑡 donde, 𝐹1 es el valor del estadístico 𝐹 (Fisher-Snedecor) obtenido para las mediciones y 𝐹𝑐𝑟𝑖𝑡 es
el valor crítico del estadístico 𝐹;
▪ 𝑡1 ≤ 𝑡𝑐𝑟𝑖𝑡 donde, 𝑡1 es el valor del estadístico 𝑡 (𝑡 de Student) obtenido para las mediciones y 𝑡𝑐𝑟𝑖𝑡 es el valor
Índice de crítico del estadístico 𝑡. 𝐸𝑡 ≤ 1 Desempeño satisfactorio y no genera señal de acción.
repetibilidad
para un nivel de probabilidad 𝑝 = 95 % . 𝐸𝑡 > 1 Desempeño no satisfactorio y genera una señal de acción.
𝑬𝒕 |𝑥1 − 𝑥2 |
𝐸𝑡 =
1 1
𝑡𝑐𝑟𝑖𝑡 × 𝑆𝑃 × √ +
𝑛1 𝑛2
donde:
𝑥1 es el valor obtenido para 𝑛1 mediciones;
𝑥2 es el valor asignado o de referencia para 𝑛2 mediciones;
𝑡𝑐𝑟𝑖𝑡 es el valor de distribución t-Student para un nivel de confianza 𝑝; y
𝑆𝑃 es la desviación estándar ponderada, y se determina como:

𝜈1 × 𝑆12 + 𝜈2 × 𝑆22
𝑆𝑃 = √
𝜈1 + 𝜈2
donde:
𝜈1 y 𝜈2 son los grados de libertad para las mediciones obtenidas y del valor asignado o de referencia
respectivamente.
Prueba de Se utiliza para determinar el mayor y el menor valor atípico de una serie de mediciones, por lo que la prueba no
Dixon debe realizarse más de una vez a la misma serie de mediciones.
𝒓𝒊𝒋 Se utiliza para determinar múltiples valores atípicos posibles en una serie de mediciones, por lo que está diseñada
para superar el efecto de enmascaramiento que pueden causar dichos valores.
𝑥𝑖+1 − 𝑥1 𝑥𝑛 − 𝑥𝑛−1
𝑟𝑖𝑗 = 𝑟𝑖𝑗 =
𝑥𝑛−𝑗 − 𝑥1 𝑥𝑛 − 𝑥𝑗+1
Donde
▪ i indica el número de valores extremos en el mismo lado (inferior o superior) de los datos que el supuesto valor
atípico 𝑖 = 1 𝑜 2
▪ j indica el número de valores extremos en el lado opuesto de los datos 𝑗 = 0, 1 𝑜 2
Se utiliza para determinar si existen pequeñas diferencias entre las varianzas de un número p de muestras cuando
todas las desviaciones típicas (𝑠𝑖 ) derivan del mismo número de mediciones n obtenidas bajo condiciones de 5 % ≤ 𝐶 El elemento verificado se acepta como correcto.
repetibilidad, por lo que, al verificar únicamente el mayor valor de ese conjunto de desviaciones típicas (𝑠𝑖 ) es 1 % ≥ 𝐶 > 5 % El elemento verificado se denomina anómalo, y se
Dócima de
una prueba unilateral de valores aberrantes. indica por medio de un asterisco sencillo.
Cochran (C)
2
𝑠𝑚á𝑥 1 % < 𝐶 El elemento se denomina estadísticamente incompatible y se
𝐶= 𝑝 indica por medio de un doble asterisco.
∑𝑖=1 𝑠𝑖2

Dócima Se utiliza para determinar si el mayor (𝑥𝑚á𝑥 ) y/o el menor (𝑥𝑚í𝑛 ) valor de una serie de n mediciones son valores
simple de atípicos, por lo que la prueba no debe realizarse más de una vez a la misma serie de mediciones.
Grubb (𝑥𝑚á𝑥 − 𝑥̅ ) (𝑥̅ − 𝑥𝑚í𝑛 ) 5 % ≤ 𝐺 El elemento verificado se acepta como correcto.
𝐺𝑚á𝑥 = 𝐺𝑚í𝑛 =
(G) 𝑠(𝑥) 𝑠(𝑥) 1 % ≥ 𝐺 > 5 % El elemento verificado se denomina anómalo, y se
Se utiliza para determinar si los dos mayores (𝑥𝑛 y 𝑥𝑛−1 ) y/o los dos menores (𝑥1 y 𝑥2 ) valores atípicos de indica por medio de un asterisco sencillo.
Dócima una serie de n mediciones son atípicos, por lo que la prueba no debe realizarse más de una vez a la misma serie 1 % < 𝐺 El elemento se denomina estadísticamente incompatible y se
doble de de mediciones. indica por medio de un doble asterisco.
Grubbs 2 2
𝑠𝑛−1,𝑛 𝑠1,2
(G) 𝐺2𝑚á𝑥 = 𝐺 2𝑚í𝑛 =
𝑠02 𝑠02
𝑘𝑖𝑗 ≤ ℎ𝐶𝑟í𝑡 El desempeño del laboratorio es satisfactorio y no genera
Examina la consistencia de los datos entre laboratorios, confirmando si algún dato de laboratorio es un valor
Estadístico señal de acción.
atípico.
h de Mandel 𝑘𝑖𝑗 > 𝑘𝐶𝑟í𝑡 El desempeño del laboratorio es no satisfactorio y genera
Indica la exactitud de los resultados de un laboratorio vs el resto de los laboratorios participantes.
una señal de acción.
Refleja la desviación de un solo los resultados medios de las pruebas de laboratorio a partir de la media general (𝑝 − 1) × 𝑡
resultados obtenidos de todos los laboratorios participantes. ℎ𝐶𝑟í𝑡 =
√𝑝 × (𝑡 2 + 𝑝 − 2)
𝑥̅𝑖𝑗 − 𝑥̿𝑗
ℎ𝑖𝑗 = Donde p es el número de laboratorios participantes y t es el valor de la
1 𝑝𝑗
2 Distribución t de Students para 𝑝 − 2 grados de libertad.
√ ∑ (𝑥̅𝑖𝑗 − 𝑥̿𝑗 )
(𝑝𝑗 − 1) 𝑖=1 Cuanto mayor sea el valor h, mayor será el sesgo del laboratorio,
indicando que peor es la veracidad.
𝑘𝑖𝑗 ≤ 𝑘𝐶𝑟í𝑡 El desempeño del laboratorio es satisfactorio y no genera
señal de acción.
𝑘𝑖𝑗 > 𝑘𝐶𝑟í𝑡 El desempeño del laboratorio es no satisfactorio y genera
Compara la desviación estándar de repetibilidad de un conjunto de datos de laboratorio con el promedio de la una señal de acción.
desviación estándar de repetibilidad de todos los demás laboratorios. 𝑝
Permite evaluar la dispersión del conjunto de datos y su precisión. 𝑘𝐶𝑟í𝑡 = √
𝑝−1
1+
Estadístico Refleja la repetibilidad de un solo laboratorio vs la repetibilidad promedio de todos los laboratorios participantes. 𝐹
k de Mandel 𝑠𝑖𝑗 √𝑝𝑗 Donde:
𝑘𝑖𝑗 = • p es el número de laboratorios participantes;
𝑝𝑗
√∑ 𝑠𝑖𝑗2 • F es el valor de la Distribución F para 𝜈1 = 𝑛 − 1 y 𝜈2 =
𝑖=1 (𝑝 − 1) × (𝑛 − 1) grados de libertad; y
• n es el número de mediciones en un laboratorio.
Cuanto mayor sea el valor de k, mayor será la desviación de los datos
del laboratorio, indicando que peor es la precisión.
ANEXO B
HERRAMIENTAS ESTADÍSTICAS DE APOYO
𝑛
1
𝑥̅ = × ∑ 𝑥𝑖
𝑛
𝑖=1
Los límites de confianza de la media 𝜇 son el intervalo en el cual existe la probabilidad de encontrar la media con una probabilidad indicada.
Para más de 30 mediciones que siguen una distribución normal, los límites de confianza se pueden determinar a partir de:
𝜇 = 𝑥̅ ± 2 × 𝜎 con un 95 % de probabilidades; y
𝜇 = 𝑥̅ ± 3 × 𝜎 con un 99.7 % de probabilidades.
Media Para menos de 30 mediciones que siguen una distribución t de Student, para 𝑛 − 1 grados de libertad y un nivel de significancia 𝛼, los límites de confianza se pueden determinar a partir
aritmética de:
(Promedio) 𝑡×𝑠
𝜇 = 𝑥̅ ±
√𝑛
donde:
𝑡 es el valor de la 𝑡 de Student;
𝜎 es la desviación típica de la población;
𝑠 es la desviación típica de la muestra; y
𝑛 es el tamaño de la muestra.
𝑛
Varianza 2
1
𝑠 = × ∑(𝑥𝑖 − 𝑥̅ )2
𝒔𝟐 𝑛−1
𝑖=1

Se utiliza para determinar el grado de dispersión de los valores alrededor de la media en una distribución de valores.
Desviación
𝑛
típica 1
𝒔(𝒙) 𝑠(𝑥) = √ × ∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1
𝑖=1

Desviación
típica Se utiliza para determinar el grado de dispersión de los valores alrededor de la media en una distribución de valores.
experimental 𝑠(𝑥)
de la media 𝑠(𝑥̅ ) =
√𝑛
𝒔(𝒙̅)
Indica el ajuste absoluto del modelo a los datos, cuán cerca están los puntos de datos observados de los valores predichos del modelo.
Error El error cuadrático medio o RMSE es una medida absoluta de ajuste.
cuadrático El error cuadrático medio (RMSE) mide la cantidad de error que hay entre dos conjuntos de datos. En otras palabras, compara un valor predicho y un valor observado o conocido.
medio
𝑬𝑪𝑴𝒊 2 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝐸𝐶𝑀𝑖 = √|𝑥̅ − 𝑥𝑟𝑒𝑓 | +
𝑛−1
donde:
𝑥𝑖 son las 𝑛 mediciones realizadas;
𝑥̅ es el promedio de las 𝑛 mediciones realizadas;
𝑥𝑟𝑒𝑓 es el valor asignado o de referencia;

Grados de 𝜈 es el número de términos en una suma menos el número de restricciones en los términos de la suma.
libertad Para una población con media 𝜇 y desviación estándar 𝜎, los grados de libertad son 𝜈 = 𝑁 donde 𝑁 representa el tamaño total de la población.
𝝂 Para una muestra de promedio 𝑥̅ y desviación estándar 𝑠, los grados de libertad son 𝜈 = 𝑛 − 1 donde 𝑛 representa el tamaño total de la muestra.
Ayudan a detectar patrones no naturales de variación en los datos resultantes de procesos repetitivos, y aportan criterios para detectar una falta de control estadístico.
El proceso se encuentra en control estadístico cuando la variabilidad está originada solamente por causas aleatorias.
Una vez determinado este nivel aceptable de variación, se toma toda desviación de ese nivel como el resultado de causas asignables que se deben identificar, eliminar o reducir.

• ̅ y de recorridos 𝑹, o de desviaciones típicas 𝒔


Gráfico de promedios 𝑿
No se dan valores estándar Se dan valores estándar Notas
Estadístico LIC: Límite inferior de control
Línea central LIC y LSC Línea central LIC y LSC
LSC: Límite superior de control
𝑋̿ ± 𝐴2 × 𝑅̅ o 𝑋0 ; 𝑅0 ; 𝑠0 ; 𝜇 y 𝜎0 se obtienen de la tabla 2 de
̅
𝑿 𝑋̿ 𝑋0 o 𝜇 𝑋0 ± 𝐴 × 𝜎0
𝑋̿ ± 𝐴2 × 𝑠̅ la referencia [7.3].

𝑹 𝑅̅ 𝐷3 × 𝑅̅, 𝐷4 × 𝑅̅ 𝑅0 o 𝑑2 × 𝜎0 𝐷1 × 𝜎0 , 𝐷2 × 𝜎0
𝒔 𝑠̅ 𝐵3 × 𝑠̅, 𝐵4 × 𝑠̅ 𝑠0 o 𝑐4 × 𝜎0 𝐵5 × 𝜎0 , 𝐵6 × 𝜎0
• Gráfico de control para valores individuales 𝒙 y recorridos móviles 𝑹
Gráficos de El recorrido móvil es la diferencia absoluta entre pares sucesivos de mediciones en una serie, o sea, la diferencia entre la primera y segunda mediciones, luego entre la segunda y la
control tercera, y así sucesivamente.
A partir de los recorridos móviles se calcula el recorrido móvil promedio 𝑅̅ y se utiliza para elaborar gráficos de control. Además, a partir de todos los datos se calcula el promedio general
𝑋̅.
No se dan valores estándar Se dan valores estándar Notas
Estadístico 𝑋0 ; 𝑅0 ; 𝜇 y 𝜎0 se obtienen de la tabla 2 de la
Línea central LIC y LSC Línea central LIC y LSC
referencia [7.3].
𝑿 𝑋̅ 𝑋̅ ± 𝐸2 × 𝑅̅ 𝑋0 o 𝜇 𝑋0 ± 3 × 𝜎0 El valor de los factores 𝑑2 ; 𝐷1 ; 𝐷2 ; 𝐷3 ; 𝐷4 ; e
indirectamente 𝐸2 (3⁄𝑑2 ) se puede obtener
𝑹 𝑅̅ 𝐷3 × 𝑅̅, 𝐷4 × 𝑅̅ 𝑅0 o 𝑑2 × 𝜎0 𝐷1 × 𝜎0 , 𝐷2 × 𝜎0 de la tabla 2 de la referencia [7.3] para 𝑛 = 2.

• Gráfico de control de medianas 𝑴𝒆 y recorridos 𝑹


Estadístico Línea central LIC y LSC
𝑴𝒆 ̅̅̅̅
𝑀𝑒 ̅̅̅̅
𝑀𝑒 ± 𝐴4 × 𝑅̅
𝐴4 se obtiene de la tabla 4 de la referencia [7.3].
• Gráfico de recorridos 𝑹
Estadístico Línea central LIC y LSC
𝑹 𝑅̅ 𝐷3 × 𝑅̅, 𝐷4 × 𝑅̅
𝐷3 y 𝐷4 se obtienen de la tabla 2 de la referencia [7.3].
.

También podría gustarte