Está en la página 1de 27

 

 
  
  
  
  
  
  
VALIDACIÓN DE MÉTODOS
DE MEDICIÓN Y ENSAYO



MODULO 1 ‐ CONCEPTOS ESTADÍSTICOS
  




 
 

©TCM. Técnicas de Control Metrológico, S.L. C/ Dtor. Alcay 16-18 - 50006 - Zaragoza Tel. 976 275 174
www.tcmetrologia.com E-mail: formacion@tcmetrologia.com
Depósito Legal: Z-1952-2010
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

INDICE

1. CONCEPTOS ESTADÍSTICOS............................................................................................................................ 3 
1.1  ESTADÍSTICA DESCRIPTIVA ............................................................................................................5 
1.1.1  Variables aleatorias y continuas .............................................................................................. 5 
1.1.2  Histogramas de frecuencias ...................................................................................................... 6 
1.1.3  Medidas de tendencia central ................................................................................................... 7 
1.1.4  Medidas de dispersión ................................................................................................................. 8 
1.1.5  Distribuciones de probabilidad ............................................................................................ 10 
1.1.6  Distribuciones continuas ......................................................................................................... 12 
1.1.6.1  Distribución normal .......................................................................................................... 13 
1.1.6.2  Distribución t-student ...................................................................................................... 17 
1.2  ESTADÍSTICA INFERENCIAL ......................................................................................................... 17 
1.2.1  Muestreo aleatorio ..................................................................................................................... 17 
1.2.2  Estimación puntual .................................................................................................................... 20 
1.2.3  Estimación por intervalos de confianza ............................................................................ 20 
1.2.4  Intervalo de confianza para la medida (con muestras pequeñas) ......................... 24 

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 2 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

1. CONCEPTOS ESTADÍSTICOS
Este apartado tiene como objetivo proporcionar los conocimientos básicos de estadística
para entender qué es, cómo se interpreta y expresa el resultado de una medida cuantitativa
con sus dos componentes, valor medido e incertidumbre asociada.

Estadística Descriptiva (deductiva). Es la parte de la estadística que establece los


modelos que determinan como se distribuyen (que probabilidad tienen) los valores de una
población.

Así por ejemplo, mediante la estadística descriptiva podemos tener una idea concreta de lo
que ocurrirá al lanzar al aire un dado o una moneda un cierto número de veces.

El modelo probabilístico de los valores de un dado no cargado asigna una probabilidad de


1/6 a cualquier valor posible, este modelo permite estimar las veces que previsiblemente
aparecerá un cierto valor tras un determinado número de lanzamientos.

La estadística descriptiva nos permite hacer una afirmación de lo que pasará con una
muestra a partir de una población conocida (razonamiento deductivo).



 
 


POBLACIÓN CONOCIDA MUESTRA
En este apartado se estudiarán algunos aspectos de la estadística descriptiva haciendo
hincapié en las distribuciones de probabilidad y, en particular, en las utilizadas con mayor
frecuencia los laboratorios de ensayo y calibración.

Estadística Inferencial (inductiva). Una vez que conocemos o hemos asumido un modelo
probabilístico para la población, podemos seguir el camino contrario, es decir, a partir de
una muestra o varias muestras hacer una afirmación sobre la población.

Por ejemplo, a partir de una encuesta se puede predecir con cierta seguridad el resultado
de unas elecciones, o haciendo un diagnóstico sobre unos individuos podemos conocer la
incidencia de una enfermedad en una determinada población.

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 3 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

La inferencia comprende la estimación de parámetros, intervalos de confianza y pruebas de


hipótesis.

La estadística inferencial nos permite hacer una afirmación sobre la población a partir de
una muestra (razonamiento inductivo).



 
 


POBLACIÓN CONOCIDA MUESTRA
La estadística inferencial tiene gran importancia en metrología ya que el valor medido y la
incertidumbre asociada son estimaciones estadísticas de la tendencia central y la
dispersión de una colección de valores verdaderos del mensurando.

En Metrología se asume que a un mensurando se le pueden atribuir un conjunto de valores


(población desconocida) que pueden ser delimitados. Las causas de este hecho se
encuentran en factores como el equipo de medida, el analista, las condiciones ambientales,
el propio mensurando, etc.

Una o varias
MESURANDO Proceso de medida (ensayo) MEDIDA
lecturas

CONJUNTO DE
VALORES Media de los
Porción de
ATRIBUIBLES AL Muestreo estadístico
valores (muestra)
valores de la
MESURANDO muestra
(población)

Un proceso de medida (medición) es un muestreo estadístico de valores posibles para un


mensurando al que se le asigna un representante de los obtenidos designado como valor
medido.

En términos estadísticos el valor medido es la media de los valores de una muestra, y a su


vez, es una estimación de la media de una población.

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 4 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

Como se verá más adelante, el valor medido es un estimador sesgado de otros valores
verdaderos del mensurando.

Regresión y Correlación. La regresión determina como una variable está relacionada con
otras variables. La correlación determina el grado en que las variables están
correlacionadas.

El análisis de regresión calcula una función (ecuación de regresión), sin embargo el análisis
de correlación produce un índice diseñado para proporcionar una imagen inmediata de
cuán estrechamente se mueven las variables.

En este curso se estudiará la regresión simple (relación de una variable dependiente Y con
una sola variable independiente X, también llamada factor o regresor). Dentro de la
regresión simple se hará hincapié en la regresión lineal, cuando las variables X e Y se
relacionan a través de una recta.

1.1 ESTADÍSTICA DESCRIPTIVA


1.1.1 Variables aleatorias y continuas
Los datos que representan a magnitudes particulares (características o parámetros) que
pueden tomar cualquier valor dentro de un cierto límite son datos continuos.

Ejemplos de datos continuos son las estaturas de un conjunto de individuos, la temperatura


en el interior de una estufa, la presión atmosférica, el peso de una muestra, etc.

X se denomina variable continua cuando puede tomar un conjunto infinito de valores en


un intervalo, por ejemplo la temperatura en el interior de una estufa puede ser 99, 100,
101,...ºC o cualquier otro valor intermedio, como 99,375ºC.

 Recuerda que...
Debido a las limitaciones de los sistemas de medición, todos los datos varían a saltos. Es
importante, sin embargo, tener presente, que algunos datos tienen la posibilidad de ser
medidos con la máxima exactitud que permitan los instrumentos utilizados. Tales datos
son inherentemente continuos, aun cuando para cualquier nivel de exactitud puedan
variar a saltos.

Los datos que representan a magnitudes particulares (características o parámetros) que


pueden tomar cualquier valor dentro de un cierto límite son datos continuos.

Ejemplos de datos continuos: Estaturas de un conjunto de individuos, la temperatura en el


interior de una estufa, la presión atmosférica, el peso de una muestra.

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 5 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

 Recuerda que...
En la práctica, debido a las limitaciones de los sistemas de medición, todos los datos
varían a saltos. Por este motivo la "distancia" entre una medición y la siguiente depende
del equipo empleado, en concreto de su resolución.

Es importante tener presente, que algunos datos tienen la posibilidad de ser medidos con
la máxima exactitud que permitan los instrumentos utilizados. Tales datos son
inherentemente continuos, aun cuando para cualquier nivel de exactitud puedan variar a
saltos.

1.1.2 Histogramas de frecuencias


Cuando se analizan conjuntos de datos continuos los valores que obtenemos pueden estar
dispersos. Surge entonces el problema de detectar el patrón de variabilidad de los datos.
Para ayudar a esta tarea existen herramientas estadísticas básicas como las distribuciones
de frecuencias y los histogramas.

⚙ Por ejemplo...
Imaginemos en la siguiente tabla se han recogido los valores obtenidos en mg al pesar 80
muestras de una sustancia.

7,33 7,32 7,34 7,40 7,28 7,29 7,35 7,33 7,34 7,28
7 31 7,35 7,32 7,33 ,33 7,36 7,32 7,31 7,35 7,36
7,26 7,39 7,29 7,32 7,34 7,30 7,34 7,32 7,39 7,30
7,33 7,33 7,35 7,34 7,33 7,36 7,33 7,35 7,31 7,33
7,37 7,38 7,38 7,33 7,35 7,30 7,31 7,33 7,35 7,33
7,27 7,33 7,32 7,31 7,34 7,32 7,34 7,32 7,31 7,36
7,30 7,37 7,33 7,32 7,31 7,33 7,32 7,30 7,29 7,38
7,33 7,35 7,32 7,33 7,32 7,34 7,32 7,34 7,32 7,33
Tabla 1.1. Tabla de las masas en mg de las muestras pesadas.

Cuando un conjunto de datos los agrupamos en intervalos o clases tenemos una


distribución de frecuencias que nos aclara la forma en la que se produce la dispersión. La
distribución se puede ver aún con más claridad en forma de representación gráfica
mediante un histograma de frecuencias.

Frecuencia Absoluta (fi). Se denomina frecuencia absoluta del valor xi de la muestra, el


número de veces que se repite ese valor. La suma de las frecuencias absolutas es igual al
tamaño de la muestra.

Frecuencia Relativa (fi/n). Se denomina frecuencia relativa del valor xi de la variable X, el


cociente entre el número de veces que se repite ese valor y el número total de valores de la
muestra (n), es decir fi/n. La suma de las frecuencias relativas es igual a 1.

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 6 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

En el histograma pueden verse las tres propiedades de una distribución como son:
tendencia central, dispersión y forma.(cambio de lugar)

Histograma de frecuencias absolutas

Es una representación gráfica que muestra la frecuencia con que se repite un valor, o un
conjunto de valores comprendido entre dos extremos (intervalo de clase).

Para construir un histograma se pueden tomar en cuenta que el número de clases (k, en el
ejemplo k=8) no debe ser demasiado pequeño ni demasiado grande.

⚙ Por ejemplo...

Utilizando los datos de los pesos de


la tabla 1.1 podríamos construir un
histograma de frecuencias
absolutas. Este gráfico nos indica
qué pesos se repiten con mayor
frecuencia.
Por lo general, es adecuado un
número entre 5 y 15. A menudo se
elige un valor aproximado a la raíz
cuadrada del tamaño de la
muestra (n, en el ejemplo n=80).
Figura 1.1. Histograma de frecuencias absolutas

1.1.3 Medidas de tendencia central


Se trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. En vez
de manejar todos los datos podemos utilizar un valor representativo de todos los valores
de la variable.

La posición o tendencia central nos indica el valor alrededor del cual se agrupan todos los
datos.

- Media: Representada por x

- Mediana: Representada por x̂

Media aritmética
n

x i
X i 1
n
Es la suma de todos los valores de la distribución dividido por el número total de datos.

xi es cada uno de los valores de la distribución y n el número total de valores.

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 7 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

Si los datos están agrupados en clases con frecuencia absoluta fi, tenemos una nueva
expresión para la media, siendo ahora xi el valor representativo de cada clase (marca de
clase).

1 k
X  xi fi
n i 1

Situando los datos analizados a lo largo de un eje, distanciados según su valor, y asignando
un peso idéntico a cada uno, la media se encuentra en el punto de equilibrio.

En el caso de que la distribución presente valores anormalmente extremos, estos pueden


distorsionar la media aritmética, haciéndola incluso poco representativa.

A los estadísticos que no son afectados por los valores extremos de la muestra, se les
denomina estadísticos robustos.

Mediana

es el valor de la distribución, suponiendo que ésta esté ordenada de menor a mayor, que
deja a su izquierda y a su derecha la misma frecuencia de observaciones, es decir, el valor
de la variable que ocupa el lugar central, supuesto un número impar de datos.

Si el número de datos fuese par, puede decirse que hay dos valores medianos, y se toma
como mediana la media aritmética de ellos.

La mediana tiene la ventaja sobre la media que en ella no influyen los valores extremos
(estadístico robusto).

1.1.4 Medidas de dispersión


Estudiaremos varias medidas de dispersión que nos indiquen variabilidad de los datos, es
decir si la diferencia entre los valores de los datos es grande o pequeña (distribución
dispersa o concentrada).

- Desviación cuadrática media: Representada por DCM

- Recorrido: Representado por R

- Varianza: Representado por s2

- Desviación típica: Representada por s

Las medidas de dispersión permiten calcular la representatividad de una medida de


posición. La media aritmética de un conjunto de datos será más representativa cuanto más
agrupados en torno a ella estén los valores promediados.

Desviación cuadrática media

Se obtiene calculando el valor medio de las diferencias al cuadrado de los valores respecto
al valor medio.

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 8 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

Es decir, dados: x1, x2, x3, x4, .... , xn

1 n
DCM   ( x i  X )2
n i 1

Recorrido

Se denomina recorrido o amplitud a la diferencia que existe entre el valor máximo y el


valor mínimo.

Es decir, dados: x1, x2, x3, x4, .... , xn

R = Máx (x1, x2…xn) – Min (x1, x2…xn)

Es una medida de dispersión absoluta (no referida al promedio).

Varianza

La varianza de una serie de valores se obtiene a partir de la siguiente expresión:


n

( x i  X )2
s2  i 1
n 1

Siendo xi cada uno de los valores y n el número total de valores.


Desviación típica

La desviación típica de una serie de valores es la raíz cuadrada de su varianza.

( x i  X )2
s i 1
n 1

Siendo xi cada uno de los valores de la distribución y n el número total de valores.

La desviación típica está ubicada en alguna parte entre los valores de la desviación más
pequeña y más grande.

Medidas de dispersión para datos agrupados

Si los datos están agrupados en clases con frecuencia absoluta fi, tenemos nuevas
expresiones para las medidas de dispersión, siendo ahora xi el valor representativo de cada
clase (marca de clase).

Desviación cuadrática media:

1 k
DCM   ( x i  X )2 f i
n i 1

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 9 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

Varianza:
k

( x i  X )2 f i
s  2 i 1

n1

Desviación típica:
k

( x i
 X )2 f i
s i 1

n1

Obsérvese la relación entre la varianza y la desviación cuadrática media:


k

( x i
 X )2 f i
n
s 
2 i 1
 DCM
n1 n 1

Cuando n es grande, el factor n/(n‐1) es prácticamente 1, y entonces:

s 2  DCM

1.1.5 Distribuciones de probabilidad


Probabilidad

Podemos estudiar la probabilidad de que un suceso ocurra si establecemos un modelo


matemático que defina el comportamiento de esa variable.

Para explicar esto vamos a utilizar un ejemplo muy sencillo y conocido; la probabilidad de
ocurrencia de los distintos resultados cuando lanzamos un dado.

Al realizar 10, 50 y un número muy elevado de lanzamientos de un dado obtenemos los


siguientes resultados:

N=10 N=50 N=∞


Resultado n f = n/N n f = n/N f = n/N
1 1 0,1 11 0,22 0,167
2 0 0 6 0,12 0,167
3 1 0,1 7 0,14 0,167
4 2 0,2 7 0,14 0,167
5 3 0,3 7 0,14 0,167
6 3 0,3 12 0,24 0,167
Tabla 1.2. Frecuencias de resultados al lanzar un dado

Representados gráficamente se observa cómo la frecuencia relativa fluctúa ampliamente


cuando hay pocas observaciones. Sin embargo, a medida que la muestra se hace más
grande, la frecuencia relativa termina por estabilizarse.

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 10 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

Figura 1.2. Representaciones gráficas de las frecuencias relativas

El valor límite de la frecuencia relativa se denomina probabilidad, es decir, en este ejemplo


es el valor que obtenemos cuando el número de lanzamientos tiende a infinito.

El gráfico nos muestra como la probabilidad de cada posible resultado dado es 1/6 (0,167)

Probabilidad  frecuencia relativa límite

Pr = lim(n/N) cuando N  

Media y varianza

Ya se ha visto como se puede calcular la media y la varianza de una muestra a partir de las
frecuencias relativas.

De la misma manera, se puede calcular la media y la varianza de una variable aleatoria a


partir de su distribución de probabilidad p(x).

   x  p( x )

 2   ( x   )2 p( x )

A µ y  2 a menudo se les denomina momentos de la población para distinguirlos de x y


s2 que son calculados para una sola muestra.

Valor esperado

Una notación de utilidad en estadística es el valor esperado. En general, el valor esperado


de la función g(X) se designa como:

E g( X )   g( x )  p( x )

Siguiendo está notación podemos reescribir la media y la varianza:

Haciendo   E ( X ) entonces g( x )  X

Haciendo g( x )  ( X   )2 entonces  2  E ( X   )2

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 11 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

1.1.6 Distribuciones continuas


Las distribuciones de variables continuas son aquellas cuya función de probabilidad puede
tomar infinitos valores.

Histograma de frecuencias relativas

La altura de las barras del histograma de frecuencias absolutas representa el número de


veces que se repite un intervalo de valores.

En un histograma de frecuencias relativas la altura de las barras tiene un valor fi/n. La


suma de las alturas de todas las barras es 1.

La altura de las barras del histograma de frecuencias relativas representa el tanto por uno
de veces que se repite un intervalo de valores.

Histograma de densidad de frecuencias relativas

Conviene hacer un cambio de escala para que sea el área de las barras del histograma lo
que represente a la frecuencia relativa.

Este cambio se consigue dividiendo la frecuencia relativa por el ancho de clase:

y = (f/n)/a

Siendo:

y, densidad de frecuencia relativa;

f/n, frecuencia relativa;

a, ancho de clase.

Figura 1.3. Histogramas de variables continuas

fi f1 f2 f
n    ...  n  1 Área  A   ahi ah2  ...  ahn  1
n n n

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 12 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

El histograma de densidad de frecuencias relativas se caracteriza porque el conjunto de sus


barras tienen un área=1. Lo que significa que cada barra deberá tener una altura;

fi
hi 
na

Siendo:

f, frecuencia absoluta;

n, número total de la muestra;

a, ancho de clase.

Función de densidad de probabilidad

Al aumentar indefinidamente el tamaño de la muestra las frecuencias relativas se


establecen como probabilidades.

A la vez el incremento de la muestra permite una definición más fina de las clases, mientras
que el área sigue siendo igual a 1.

Figura 1.4. Función de densidad de probabilidad

El histograma de densidad de frecuencia relativa se transforma en una curva denominada


Función de densidad de probabilidad.

Una porción de área delimitada por un intervalo cualquiera [a,b] de la variable aleatoria
continua representa la probabilidad que tienen el conjunto de valores comprendidos en
dicho intervalo.

1.1.6.1 Distribución normal


En la mayoría de los procesos industriales las características de calidad se distribuyen
según una función cuyas propiedades son perfectamente conocidas. Se trata de la
distribución Normal o de Gauss.

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 13 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO


-  + x

Figura 1.5. Campana de Gauss

Propiedades de la distribución normal

1. Campo de existencia desde + hasta -

2. A medida que se desplaza desde el punto medio (X=µ) hacia izquierda o derecha,
F(X) decrece de forma simétrica y exponencial:

- tiene forma de campana;

- es simétrica respecto a la media (µ).

3. En el punto medio coinciden la media, la moda y la mediana.

4. El valor máximo se da en x = µ

1
y
 2
5. Los puntos de inflexión son x = µ +  y x = µ - 

6. En toda distribución normal se puede saber el área que ocupa un intervalo a través
del estadístico Z que representa el número de desviaciones típicas que nos
separamos de la media. Por ejemplo;

Para µ ±  (Z=1) encontramos el 68,26% de los datos.

Para µ ± 2 (Z=2) se encontramos el 95,45% de los datos.

Para µ ± 3 (Z=3) se encontramos el 99,73% de los datos.


f(x)


68,26%

95,45% (2)


-  +
x
99,73% (3)
Figura 1.6. Distribución de probabilidad normal

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 14 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

Interpretación de la distribucion normal

Con frecuencia se desea calcular la probabilidad (es decir, el área bajo la curva), más allá de
un valor X.

Primero se debe calcular el valor Z, es decir, a cuantas desviaciones típicas se encuentra el


valor X de la media.
X μ
Z
σ
A continuación utilizamos las tablas en las que entrando con Z se obtiene el área (en tanto
por uno) que queda más allá del valor X.

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 15 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

Tabla 1.2. Tabla de valores de área bajo la distribución normal estándar

X   X

Z Z

Pr(x < X) Pr(x >X)

|Z| x.x0 x.x1 x.x2 x.x3 x.x4 x.x5 x.x6 x.x7 x.x8 x.x9
4,0 0,00003
3,9 0,00005 0,00005 0,00004 0,00004 0,00004 0,00004 0,00004 0,00004 0,00003 0,00003
3,8 0,00007 0,00007 0,00007 0,00006 0,00006 0,00006 0,00006 0,00005 0,00005 0,00005
3,7 0,00011 0,00010 0,00010 0,00010 0,00009 0,00009 0,00008 0,00008 0,00008 0,00008
3,6 0,00016 0,00015 0,00015 0,00014 0,00014 0,00013 0,00013 0,00012 0,00012 0,00011
3,5 0,00023 0,00022 0,00022 0,00021 0,00020 0,00019 0,00019 0,00018 0,00017 0,00017
3,4 0,00034 0,00032 0,00031 0,00030 0,00029 0,00028 0,00027 0,00026 0,00025 0,00024
3,3 0,00048 0,00047 0,00045 0,00043 0,00042 0,00040 0,00039 0,00038 0,00036 0,00035
3,2 0,00069 0,00066 0,00064 0,00062 0,00060 0,00058 0,00056 0,00054 0,00052 0,00050
3,1 0,00097 0,00094 0,00090 0,00087 0,00084 0,00082 0,00079 0,00076 0,00074 0,00071
3,0 0,00135 0,00131 0,00126 0,00122 0,00118 0,00114 0,00111 0,00107 0,00104 0,00100
2,9 0,00187 0,00181 0,00175 0,00169 0,00164 0,00159 0,00154 0,00149 0,00144 0,00139
2,8 0,00256 0,00248 0,00240 0,00233 0,00226 0,00219 0,00212 0,00205 0,00199 0,00193
2,7 0,00347 0,00336 0,00326 0,00317 0,00307 0,00298 0,00289 0,00280 0,00272 0,00264
2,6 0,00466 0,00453 0,00440 0,00427 0,00415 0,00402 0,00391 0,00379 0,00368 0,00357
2,5 0,00621 0,00604 0,00587 0,00570 0,00554 0,00539 0,00523 0,00508 0,00494 0,00480
2,4 0,00820 0,00798 0,00776 0,00755 0,00734 0,00714 0,00695 0,00676 0,00657 0,00639
2,3 0,01072 0,01044 0,01017 0,00990 0,00964 0,00939 0,00914 0,00889 0,00866 0,00842
2,2 0,01390 0,01355 0,01321 0,01287 0,01255 0,01222 0,01191 0,01160 0,01130 0,01101
2,1 0,01786 0,01743 0,01700 0,01659 0,01618 0,01578 0,01539 0,01500 0,01463 0,01426
2,0 0,02275 0,02222 0,02169 0,02118 0,02068 0,02018 0,01970 0,01923 0,01876 0,01831
1,9 0,02872 0,02807 0,02743 0,02680 0,02619 0,02559 0,02500 0,02442 0,02385 0,02330
1,8 0,03593 0,03515 0,03438 0,03362 0,03288 0,03216 0,03144 0,03074 0,03005 0,02938
1,7 0,04457 0,04363 0,04272 0,04182 0,04093 0,04006 0,03920 0,03836 0,03754 0,03673
1,6 0,05480 0,05370 0,05262 0,05155 0,05050 0,04947 0,04846 0,04746 0,04648 0,04551
1,5 0,06681 0,06552 0,06426 0,06301 0,06178 0,06057 0,05938 0,05821 0,05705 0,05592
1,4 0,08076 0,07927 0,07780 0,07636 0,07493 0,07353 0,07215 0,07078 0,06944 0,06811
1,3 0,09680 0,09510 0,09342 0,09176 0,09012 0,08851 0,08691 0,08534 0,08379 0,08226
1,2 0,11507 0,11314 0,11123 0,10935 0,10749 0,10565 0,10383 0,10204 0,10027 0,09853
1,1 0,13567 0,13350 0,13136 0,12924 0,12714 0,12507 0,12302 0,12100 0,11900 0,11702
1,0 0,15866 0,15625 0,15386 0,15151 0,14917 0,14686 0,14457 0,14231 0,14007 0,13786
0,9 0,18406 0,18141 0,17879 0,17619 0,17361 0,17106 0,16853 0,16602 0,16354 0,16109
0,8 0,21186 0,20897 0,20611 0,20327 0,20045 0,19766 0,19489 0,19215 0,18943 0,18673
0,7 0,24196 0,23885 0,23576 0,23270 0,22965 0,22663 0,22363 0,22065 0,21770 0,21476
0,6 0,27425 0,27093 0,26763 0,26435 0,26109 0,25785 0,25463 0,25143 0,24825 0,24510
0,5 0,30854 0,30503 0,30153 0,29806 0,29460 0,29116 0,28774 0,28434 0,28096 0,27760
0,4 0,34458 0,34090 0,33724 0,33360 0,32997 0,32636 0,32276 0,31918 0,31561 0,31207
0,3 0,38209 0,37828 0,37448 0,37070 0,36693 0,36317 0,35942 0,35569 0,35197 0,34827
0,2 0,42074 0,41683 0,41294 0,40905 0,40517 0,40129 0,39743 0,39358 0,38974 0,38591
0,1 0,46017 0,45620 0,45224 0,44828 0,44433 0,44038 0,43644 0,43251 0,42858 0,42465
0,0 0,50000 0,49601 0,49202 0,48803 0,48405 0,48006 0,47608 0,47210 0,46812 0,46414

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 16 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

1.1.6.2 Distribución t-student


Cuando la información de la que disponemos es una muestra representativa de la
población, cuyo tamaño es n, utilizamos la media muestral como estimador de la media
poblacional (µ) y desviación típica mustral como estimador de la sigma poblacional (). En
este caso, las ecuaciones que definen la distribución normal deben ser modificadas y la
variable t sustituye al factor de cobertura Z.

El valor de t depende de la probabilidad requerida así como del tamaño de la muestra o


grados de libertad, iguales a n-1.

Distr. normal
Distr. t´student con 5 gdl
Distr. t-student con 2 gdl

Figura 1.7. Distribución de probabilidad normal

Para tamaños de muestra grandes gdl = , el valor de t coincide con el de Z en la


distribución normal.

 ¿Sabías que...?
La distribución de Student fue descrita en 1908 por William
Sealy Gosset que trabajaba en las destilerías Guinness en
Dublín. Debido a que uno de los investigadores había publicado
un artículo que contenía secretos industriales de la destilería,
Guinness prohibió a sus empleados la publicación de artículos.
Por eso Gosset publicó sus investigaciones con el pseudónimo
Student.

1.2 ESTADÍSTICA INFERENCIAL


1.2.1 Muestreo aleatorio
Al recoger una observación individual, esta puede asumir cualquier valor de la población
con la probabilidad que corresponde a ese valor.

Por tanto, se puede afirmar que “cada observación individual en una muestra aleatoria
es una variable aleatoria cuya distribución de probabilidad es la de la población p(x)
de la que procede.”

De lo dicho se desprende que la media y la desviación típica de una observación individual


son μ y , respectivamente.

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 17 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

Por lo tanto, se concluye que una muestra aleatoria simple es aquella cuyas n
observaciones X1, X2,…, Xn son independientes. La distribución de cada X es la distribución
de la población p(x).

p1(x) = p2(x) =….= pn(x) = p(x)

Cada observación es una variable aleatoria que tiene la media μ y desviación típica .

La aleatoriedad hace probable que una muestra sea representativa de una población
subyacente a partir de la cual se extrae.

⚙ Por ejemplo...
Imaginemos que la media de la población es μ = 69. Supongamos que tomamos de forma
aleatorio 5 individuos pertenecientes a esta población;

Los valores obtenidos de la muestra son 65, 67, 70, 72 y 76.

La media de estos valores independientes procedentes de la población esX=70.

Por lo tanto, en nuestro ejemplo la media de la muestra 70 está más cerca de μ=69 que la
mayor parte de las observaciones individuales en la muestra.

Figura 1.8. Observaciones independientes dentro de una población

Debido a que se promedia, la media de la muestra no varía tanto como los individuos de la
población. Esto se debe a que, al calcular la media de la muestra, una observación
individual extrema como X=76 tiende a diluirse por observaciones más típicas X=70, o
tiende a ser compensada por una observación en el otro extremo como X=65.

El objetivo del muestreo aleatorio es realizar una inferencia acerca de la población.

Se espera que la media de la muestra conocidaX sea una estimación aproximada de la


media de la población μ. Al realizar varios muestreos los valores deX varían de muestra a
muestra alrededor de μ.

A continuación demuestra que el promedio de la media de la muestra es igual a μ.

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 18 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

La media de la muestra se definió como:

1
X X 1  X 2  ...  X n 
n
Al ser una combinación de variables aleatorias,X también es una variable aleatoria cuya
esperanza es:

1
E( X )  E ( X 1 )  E ( X 2 )  ...  E ( X n )
n
Cada observación X tiene la distribución de la población con media , por tanto:

1
E( X )      ...     1 n   
n n
Es probable que una media se encuentre un poco por encima o por debajo de µ debido a las
fluctuaciones del muestreo (suerte de extracción).

Partiendo de la expresión:

1
X X 1  X 2  ...  X n 
n
y calculando la varianza de una combinación lineal de variables aleatorias independientes,
se tiene:

1 2 1 2 1
 X2   X  2  X  ...  2  Xn2
n2 1
n 2
n
De nuevo se tiene en cuenta que cada observación X tiene la distribución de la población
p(x), con varianza s, de modo que:

1 2 n 2
  2     ...     2
2 2 2
X
n n
Por tanto:
2
 X2 
n
La desviación típica de la media con respecto a su objetivo μ representa el error de de
estimación, por lo que suele llamarse Error Estándar.


EE   X 
n

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 19 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

Esta fórmula muestra que cuanto más grande es el valor de n, más pequeño se hace el error
estándar. Es decir, cuanto más grande es la muestra, mejor estimaX la media de la
población μ.

1.2.2 Estimación puntual


Un estimador puntual de un parámetro desconocido es un estadístico que proporciona un
valor que se utiliza para hacer una estimación del valor del parámetro desconocido. Por
ejemplo, tres parámetros relacionados con las características de la calidad de un proceso,
sobre los que frecuentemente se desea hacer inferencias, son:

 la media ;

 la varianza  2;

 la proporción .

Los valores μ,  2 y  son constantes que se desconocen denominados parámetros de la


población.

Los estimadores puntuales (estadísticos) más recomendados para estimar estos


parámetros son, respectivamente:

 La media de la muestra: ˆ  x ;

 La varianza de la muestra: ˆ 2  s 2 ;

 La proporción en la muestra ˆ  p  x / n , donde x es el número de elementos que


cumplen una determinada condición en la muestra de tamaño n.

X y s2 y p son variables aleatorias, cada una de ellas varía de muestra a muestra, según su
distribución muestral.

Colocar un "sombrero" (^) sobre un parámetro es una manera de denotar un estimador


puntual del correspondiente parámetro, puesto que los estimadores no son únicos. Por
ejemplo, la estimación de la media ̂ podría hacerse con la media muestral x o bien, con la
mediana ~ x o con la moda, dado que los tres son diferentes medidas de la tendencia central.
1.2.3 Estimación por intervalos de confianza
Mediante los valores x y s2 podemos estimar los valores de μ y  2, sin embargo vimos que
x fluctúa entorno a μ, algunas veces estará por encima y otras por debajo, debido al error
de muestreo.

Por tanto, la estimación puntual dirá poco acerca del parámetro poblacional cuando la
variación entre una estimación y otra sea muy grande. Mejor que estimar el valor de μ a
partir de un estimador puntual sería construir un intervalo asociado al estimador que
probablemente contenga a μ.

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 20 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

Una forma de saber lo variable que es un estimador es calculando la desviación típica o


error estándar del estadístico visto como una variable aleatoria.

Por ejemplo, dado que las medias muestrales fluctúan siguiendo la ley normal (cuando el
tamaño de la muestra es grande), se puede trazar un intervalo que recoja a un porcentaje
alto de las medias muestrales, por ejemplo al 95%.

Distribución de los
valores de la población
 Distribución de las medias muestrales
de tamaño n

Z x

Figura 1.9. Distribución de las medias muestrales

De igual modo, a partir de una media muestral cualquiera se puede trazar el mismo
intervalo  Z x , este intervalo recogerá en su interior a la media poblacional en un
porcentaje de ocasiones equivalente al de las medias muestrales recogidas en dicho
intervalo.

X Intervalo donde se encuentra la media de la población con una


confianza determinada por el área.

σ
μ X Z
n
Z x El tamaño del intervalo que contenga a la media poblacional
dependerá, por un lado del valor del error estándar (grado de
Figura 1.10. Intervalo fluctuación de las medias muestrales) y por otro, de la confianza
que recoge la media
con la que se quiera garantizar que, en efecto, el intervalo
poblacional
contenga a μ.

El valor del error estándar se calcula a partir de la desviación típica de la muestra (similar a
la de la población, dado el tamaño grande de la muestra) y del tamaño de la muestra.

La confianza que se suele elegir es el 95% lo que dará lugar a un intervalo correcto 19 de
cada 20 veces.


Figura 1.11. Área con el 95% de los valores

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 21 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

A partir de la tabla de la distribución normal se observa que para una Pr=0,025, el valor Z
debe ser 1,96. Es decir, es necesario ir por encima y por debajo de la media 1,96 errores
estándar para alcanzar el 95% del área.

Por tanto:

Pr(X  1,96σ X    X  1,96σ X )  95%

Esta expresión puede voltearse dando lugar a la siguiente:

Pr(μ  1,96σ X  X  μ  1,96σ X )  95%

Las dos expresiones anteriores son ciertas, pero no deben dar lugar a error, en ambas el
valor de μ es constante y X una variable.

Pr(X  1,96σ X    X  1,96σ X )  95%

 1,96 X   1,96 X

Pr(μ  1,96σ X  X  μ  1,96σ X )  95%

En metrología, los intervalos de confianza se suelen construir con una confianza del
95,45%, de este modo, hay que desplazarse 2 errores estándar por encima y por debajo de
la media.

Pr( X  2σ X  μ  X  2σ X )  95 ,45%

Pr(μ  2σ X  X  μ  2σ X )  95 ,45%

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 22 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

Normalmente se desconoce la desviación típica de la población (s), se puede calcular un


intervalo de confianza para la media poblacional utilizando en su lugar la desviación típica
s de los valores de la muestra, es decir:

s
 X Z
n

Esta expresión solamente es válida cuando el tamaño de la muestre es grande, n>30.

⚙ Por ejemplo...
Supongamos que se analizan 180 muestras de agua de una zona geográfica. Cierto analito
da una concentración media de 0,82 mg/L y una desviación típica de 0,48 mg/L. ¿Cómo
podemos calcular un intervalo de confianza del 95,45% para el valor medio de
concentración de dicho analito?

Para calcular el intervalo de confianza necesitamos la desviación típica “” de la


población.


 X Z
n

La muestra estadística que tenemos está compuesta de 180 valores, por lo que podemos
considerar su desviación típica “s” como una estimación razonable de la desviación típica
de la población .

Sustituyendo,

 0 ,48
 X Z  0 ,82  2  0 ,82  0 ,071
n 180

Es decir, la media poblacional se encuentra entre 0,749 y 0,891 mg/L.

Pr( 0 ,749    0 ,891 )  95 ,45%

En general, construir un intervalo al 100(1-)% de confianza para un parámetro


desconocido , consiste en estimar dos valores I y S tales que la probabilidad de que  se
encuentre entre ellos sea 1-, es decir;

Pr(I    S) = 1‐

donde I y S son el intervalo de confianza buscado [I, S].

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 23 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

1.2.4 Intervalo de confianza para la medida (con muestras pequeñas)


Se trata de encontrar los números I y S tales que el parámetro  se encuentre entre ellos
con una probabilidad de 1-, es decir:

Pr(I    S) = 1‐

El procedimiento general para deducir el intervalo consiste en partir del estadístico que
involucra al parámetro de interés y que tiene una distribución conocida. Tal estadístico es:

X 
t
s/ n

el cual sigue una distribución t-student con n-1 grados de libertad. Por lo tanto, se pueden
ubicar en la tabla de esta distribución o en su gráfica, dos valores críticos t  / 2 y  t / 2 tales
que

X 
Pr(  t  / 2   t / 2 )  1  
s/ n

Distribución estadístico t
gdl = n-1
=0,05  /2=0,025

 t / 2 t / 2  
0,025 1-=0,95 0,025

0
Figura 1.12. Distribución del estadístico t

Despejando en la ecuación anterior hasta dejar sólo en medio de las desigualdades al


parámetro de interés, queda;

 s s 
Pr  X  t  / 2    X  t / 2   1 
 n n

Es decir,

s s
I  X  t / 2 y S  X  t / 2
n n

Son los valores buscados que definen un intervalo al 100(1-)% para la media desconocida
.

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 24 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

En la tabla de la distribución t se puede ver que para una muestra mayor de 50, el intervalo
95% para la media  es aproximadamente:

s
X 2
n

Otro modo de analizar el intervalo de confianza para la media poblacional a partir de


muestras pequeñas es la utilización de s en lugar de  introduce una fuente adicional de no
confiabilidad, especialmente si la muestra es pequeña.

Para conservar el intervalo de confianza del 95% es necesario ampliar el tamaño del
intervalo.

Lo anterior se hace sustituyendo el valor Z tomado de la distribución normal por el valor t,


más grande, tomado de la distribución t de Student.

s
  X t
n

t es un valor tabulado, cuyo valor depende de:

 grados de libertad para obtener t. Es igual a los grados de libertad empleados para
calcular s, es decir a la cantidad de información utilizada para calcularla. Es el valor
del denominador gdl=n-1;

 confianza con la que se quiere determinar el intervalo.

Para tamaños de muestra grandes gdl = n = , el valor de t coincide con el de Z.

En la página siguiente se incluye a continuación una tabla para obtener el valor de t en


función de los grados de libertad y la confianza en %. En la tabla se proporciona el valor
tp;; siendo el primer subíndice p, la fracción recogida dentro del intervalo de confianza
(p=1‐) y el segundo subíndice  los grados de libertad.

Siguiendo la notación empleada con carácter general en el curso t/2;gdl, el primer subíndice,
/2, representa al área de una cola.

Por ejemplo, t/2;5 = t0,025;5 se obtendría en la tabla entrando por t0,95;5.

Estos valores tabulados también pueden obtenerse empleando hojas de cálculo. Por
ejemplo para obtener tp; = t/2;gdl con Excel debemos emplear la siguiente expresión:

DISTR.T.INV(;gdl)

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 25 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

Grados de Fracción p en tanto por ciento


libertad (υ) 68,27 90 95 95,45 99 99,73
VALOR DE t (p;υ)
1 1,84 6,31 12,71 13,97 63,66 235,78
2 1,32 2,92 4,30 4,53 9,92 19,21
3 1,20 2,35 3,18 3,31 5,84 9,22
4 1,14 2,13 2,78 2,87 4,60 6,62
5 1,11 2,02 2,57 2,65 4,03 5,51
6 1,09 1,94 2,45 2,52 3,71 4,90
7 1,08 1,89 2,36 2,43 3,50 4,53
8 1,07 1,86 2,31 2,37 3,36 4,28
9 1,06 1,83 2,26 2,32 3,25 4,09
10 1,05 1,81 2,23 2,28 3,17 3,96
11 1,05 1,80 2,20 2,25 3,11 3,85
12 1,04 1,78 2,18 2,23 3,05 3,76
13 1,04 1,77 2,16 2,21 3,01 3,69
14 1,04 1,76 2,14 2,20 2,98 3,64
15 1,03 1,75 2,13 2,18 2,95 3,59
16 1,03 1,75 2,12 2,17 2,92 3,54
17 1,03 1,74 2,11 2,16 2,90 3,51
18 1,03 1,73 2,10 2,15 2,88 3,48
19 1,03 1,73 2,09 2,14 2,86 3,45
20 1,03 1,72 2,09 2,13 2,85 3,42
25 1,02 1,71 2,06 2,11 2,79 3,33
30 1,02 1,70 2,04 2,09 2,75 3,27
35 1,01 1,69 2,03 2,07 2,72 3,23
40 1,01 1,68 2,02 2,06 2,70 3,20
45 1,01 1,68 2,01 2,06 2,69 3,18
50 1,01 1,68 2,01 2,05 2,68 3,16
100 1,01 1,66 1,98 2,03 2,63 3,08
 1,00 1,65 1,96 2,00 2,58 3,00

Tabla 1.3. Valores t

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 26 de 27
CURSO
VALIDACIÓN DE LOS MÉTODOS DE ENSAYO

⚙ Por ejemplo...
Se analiza una muestra repitiéndose 4 veces la medición en las que obtienen los
siguientes valores 64, 65, 63, 64. Suponiendo que no existe más error en la medida que el
debido a la variabilidad observada, queremos calcular un intervalo de confianza del
95,45% para el valor verdadero de la muestra.

Primero calculamos la media y la desviación típica:

X
64  65  63  64
 64 s
( x  X ) 2

 0 ,816
4 n 1

Según la tabla de la distribución t de student, para una confianza del 95% y gld= n - 1=3
se requiere una t = 3,18.

X  64
s 0,816
  X t  64  3,18  64  1 ,30
n 2

Área 95,45% Pr( 62 ,70    65 ,30 )  95%

t  sx

Es decir, con la información disponible, el valor verdadero de la característica se


encuentra entre 62,70 y 65,30.

El valor de t(/2;gdl) se puede obtener utilizando la función Excel DISTR.T.INV


(probabilidad; grados de libertad). En el argumento probabilidad debemos poner la
significación de la prueba () y en el argumento grados de libertad debemos poner el
número de observaciones menos uno (n-1).

En este caso la fórmula sería:

DISTR.T.INV(1-0,95;3)

Una forma de reducir el intervalo calculado sería aumentar el tamaño de la muestra, ya que
de este modo aumenta el denominador y además se reduce el valor t.

s
  X t
n

En realidad no se puede afirmar que el valor verdadero se encuentra en un intervalo


calculado de este modo ya que no se han considerado todas las fuentes de error presentes
durante la medición como la resolución del instrumento, las condiciones ambientales, el
operador, etc.

©TCM VMME.MOD1.4 01/19


Depósito Legal: Z-1952-2010 Pág 27 de 27

También podría gustarte