Ta-129 - Distribucion

Simposio de Metrología 2004 25 al 27 de Octubre
DISTRIBUCIÓN DE LA MEDIA Y EL TEOREMA DEL LÍMITE CENTRAL

Wolfgang A. Schmid
Centro Nacional de Metrología
Tel.: (442) 211 0554, e-mail: wschmid@cenam.mx
Resumen: De acuerdo al Teorema del Límite Central, la distribución de la media X de una serie de
mediciones repetidas (X1, X2, … Xn) se aproxima a una distribución normal, independientemente de la
distribución de los datos originales xi . Este resultado importante para la estimación de la incertidumbre en
mediciones se prueba con datos aleatorios provenientes de diferentes distribuciones. En particular, se
analiza el caso de datos medidos con un instrumento con resolución “burda” y la interacción entre la
dispersión de los datos cuantificada por su desviación estándar y la resolución del instrumento en la
incertidumbre combinada. Se observa un incremento de la dispersión de los datos como efecto del redondeo,
que con los conceptos de metrología se interpreta como una combinación de las incertidumbres por
repetibilidad y resolución.
1. INTRODUCCIÓN convolución Y también será normal. Sin embargo,

aún si las distribuciones de Xi no son normales, la
El mejor estimado de una magnitud X con un error distribución de Y frecuentemente se puede
asociado que varía de forma aleatoria generalmente aproximar mediante una distribución normal debido
es la media X de un número n de mediciones al Teorema del Límite Central. Este teorema
independientes Xi realizadas bajo las mismas establece que la distribución de Y será
condiciones: aproximadamente normal con esperanza
N N
1 n ) y varianza V (Y ) = ∑ ci 2 ⋅ V ( X i )
X = ⋅ ∑ Xi (1) E (Y ) = ∑ c E( Xi i
n i =1 i =1 i =1
donde E ( X i ) es la esperanza de Xi y V ( X i ) es la
La incertidumbre u de X se estima mediante la varianza de Xi , si las Xi son independientes y V (Y )
desviación estándar experimental de la media: es mucho más grande que cualquier componente
individual ci ⋅ V ( X i ) de una Xi cuya distribución no
( )2
n
s( X i ) 1 es normal.”
u A ( X ) = s( X ) = = ⋅ ∑ Xi − X (2)
n n ⋅ (n − 1) i =1
En el caso de una serie de mediciones repetidas
(X1, X2, … Xn), el Teorema del Límite Central es
donde s(Xi) es la desviación estándar experimental
de las mediciones individuales. El índice A indica aplicable a la media X donde ci = 1 n
que se trata de un “método tipo A” para estimar la n
1
incertidumbre. X =∑ ⋅ Xi (3)
i =1 n
Para determinar el nivel de confianza relacionado
con la incertidumbre de una magnitud, es necesario con la particularidad que todas las Xi provienen de
conocer su distribución. Del Teorema del Límite la misma distribución con la misma esperanza
Central resulta que la distribución de la media X de E ( X i ) = µ y varianza V ( X i ) = σ 2 .
una serie de mediciones repetidas e independientes
(X1, X2,…Xn) se aproxima a una distribución normal, Para la esperanza y varianza de X resulta:
independientemente de la distribución de los Xi . n
1
E( X ) = ∑ ⋅ E( X i ) = µ (4)
i =1 n
Para resaltar esto, véase por ejemplo [1], G.2.1.:
N
2
“Si Y = c 1 X 1 + c 2 X 2 + ...c N X N = ∑
i =1
ci X i y todas n
 1
V ( X ) = ∑   ⋅V ( X i ) =
σ2
(5)
las Xi se caracterizan mediante distribuciones i =1  n  n
normales, entonces la distribución resultante de la
1
2. DESARROLLO 1500
Con simulaciones numéricas se muestra para

diferentes tipos de distribución de los Xi la 1000
Frecuencia
aproximación de la distribución de la media X n de
n mediciones repetidas a una distribución normal.
500
En hojas de cálculo de Excel se generan 10 000
juegos de datos aleatorios Xki, (i = 1,... 10; k = 1,...
10 000) simulando de esta manera 10 000 ciclos de 0
la medición. Después se calculan las medias para
cada uno de los 10 000 ciclos (con índice k)
9
,1
,5
,9
,3
,7
,1
0,
1,
1,
2,
2,
-3
-2
-1
-1
-0
-0
Clase
1 n
( X n )k = ⋅ ∑ X ki (6)
n i =1 Fig. 1: Histograma los Xi ~ N(0, 1)
1500
para n = 2, 3, 5 y 10 y se generan histogramas de
X2
frecuencia para ver las distribuciones de los X n .
1000
Frecuencia
Las desviaciones estándar de los X n
500
10 000
s( X n ) =
1
(
⋅ ∑ µ − ( X n )k
10 000 k =1
)2
(7)
0
,1 2,5 1,9 1,3 0,7 ,1 0,5 1,
1
1,
7
2,
3
2,
9
9
,1
,5
,9
,3
,7
,1
-3 - - - - -0
0,
1,
1,
2,
2,
se comparan con los valores teóricos que se
-3
-2
-1
-1
-0
-0
Clase
esperan de acuerdo a (5): 1500
σ X3
V ( Xn ) = (8) 1000
Frecuencia
n
donde σ es la desviación estándar de los Xi .
500
3. DISTRIBUCIÓN NORMAL: Xi ~ N(0, 1) 0

,1 2,5 1,9 1,3 0,7 ,1 0,5 1,
1
1,
7
2,
3
2,
9
5
9
,1
,5
,9
,3
,7
,1
En el primer ejemplo se consideran datos Xi -3 - - - - -0

0,
1,
1,
2,
2,
-3
-2
-1
-1
-0
-0
Clase
provenientes de una distribución normal con µ = 0
1400
y σ = 1.
1200
X 10
La figura 1 muestra la distribución de los datos 1000
generados Xi , la figura 2 las distribuciones de X 2 y
Frecuencia
800
X 3 y la de X 10 y una comparación con una normal.
600
Como se espera, las distribuciones de las X n se
400
parecen a distribuciones normales. Un incremento
en n genera distribuciones más estrechas, lo cuál se 200
observa de forma cuantitativa mediante las
0
desviaciones estándar s( X n ) calculadas con los -1,0 -0,5 0,0 0,5 1,0
Clase
10 000 datos de los X n , que siguen la expresión
σ Fig. 2: Distribución de las medias X 2 , X 3 y X 10 y
s( X n ) ≈ (9) comparación con una distribución normal con
n
σ = 1 10 = 0,316 (línea).
2
1600 4. DISTRIBUCIÓN UNIFORME: Xi ~ U(0, 1)
X2 A continuación se desarrolla el ejercicio con datos

1200
de los Xi provenientes de una distribución uniforme
Frecuencia
entre 0 y 1. La figura 4 muestra la distribución de Xi ,

800
la figura 3 las distribuciones de X 2 , X 3 , X 5 y X 10
400 y una comparación con una distribución normal (en
el caso de X 10 ). Se observa cómo las
0 distribuciones de las X n , incrementando n se
0 1 2 3 4 5 6 7 8 9 1
0, 0, 0, 0, 0, 0, 0, 0, 0, acercan cada vez más a distribuciones normales.
Clase Igual que en el caso anterior, las desviaciones
1600 estándar s( X n ) resultan de acuerdo a la expresión
X3 (9): s( X n ) ≈ 0,289 n
1200
Frecuencia
800 600
500
400
400
Frecuencia
0 300
0 1 2 3 4 5 6 7 8 9 1
0, 0, 0, 0, 0, 0, 0, 0, 0, 200
Clase
100
1600
0
X5
1200
1
2
3
4
5
6
7
8
9
0
1
0,
0,
0,
0,
0,
0,
0,
0,
0,
Frecuencia
Clase
800
Fig. 4: Histograma los Xi provenientes de una
400 distribución uniforme U(0, 1)
0
5. DISTRIBUCIÓN BERNOULLI: Xi ~ B(0, 1)
1
9
0
1
0,
0,
0,
0,
0,
0,
0,
0,
0,
Clase Como siguiente ejemplo se desarrolla el ejercicio

1500 con una distribución Bernoulli, que genera los
valores 0 y 1 con la misma probabilidad de 50%.
1250 X 10
6000
1000
Frecuencia
5000
750
4000
Frecuencia
500
3000
250 2000
0 1000
0,2 0,3 0,4 0,5 0,6 0,7 0,8
Clase 0
1
0
5
6
7
8
1
2
3
4
Fig. 3:.Distribución de las medias X 2 , X 3 , X 5 y

,1
0,
0,
0,
0,
0,
0,
0,
0,
0,
-0
Clase
X 10 en el caso de Xi ~ U(0,1) y la comparación con
una normal con σ = 0,289 10 = 0,091 (línea). Figura 5: Histograma los Xi ~ B(0, 1).
3
6000 La figura 5 muestra la distribución de Xi y la figura 6

5000 las de X 2 , X 3 , X 5 y X 10 . También en este caso
X2
4000 se observa como las distribuciones de las X n se
Frecuencia
3000 acercan a una normal y que las desviaciones

2000 estándar siguen la expresión (9): s( X n ) ≈ 0,5 n.
1000
6. DISTRIBUCIÓN NORMAL CON
0 RESOLUCIÓN FINITA: X ~ rnd[N(0,25 , 0,5)]
2
4
1
9
0
1
1
0,
0,
0,
0,
0,
0,
0,
0,
0,
,
-0
Clase Como último ejemplo se desarrolla el caso de datos

4000 Xi provenientes de una distribución normal y
redondeados a enteros X ~ rnd[N(µ, σ0)], simulando
3000
X3 de esta forma la medición de datos con errores
aleatorios normalmente distribuidos, utilizando un
Frecuencia
2000 instrumento con resolución de 1 unidad 1.
1000 Con la selección de los parámetros de µ = 0,25 y

σ 0 = 0,5 para la distribución normal y el número
0
limitado de 10 000 datos generados resultó en el
ejemplo analizado que la generación de los datos se
0
1
1
9
,1
0,
0,
0,
0,
0,
0,
0,
0,
0,
-0
Clase limita a los valores -1, 0, 1, y 2 con una distribución

asimétrica a cero. En mediciones reales con un
3000 instrumento de medición con una resolución “burda”
X5 una situación como está es común.
Frecuencia
2000
7000
1000 6000 Xi
5000
0
Frecuencia
4000
0
1
5
9
1
0,
0,
0,
0,
0,
0,
0,
0,
0,
,
-0
Clase
3000
2500
2000
X 10
2000 1000
0
1500
Frecuencia
Clase -2 -1 0 1 2
1000 Fig. 7: Distribución de los Xi provenientes de una

distribución normal redondeada
500 X ~ rnd[N(0,25 , 0,5)] y la función de distribución de
la cuál provienen los datos originales (línea).
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
La figura 7 muestra la distribución de Xi , la figura 8
Clase las distribuciones de X 2 , X 3 , X 5 y X 10 . También
Figura 6: Distribución de las medias X 2 , X 3 , X 5 y en este caso se observa que las distribuciones de
los X n se acercan a una distribución normal.
X 10 en el caso de Xi ~ B(0, 1) y la comparación con
una normal con σ = 0,5 10 = 0,158 (línea)
1
Se usa la notación “rnd” para “redondear a enteros”.
4
5000
En la verificación de la expresión (9) uno se
enfrenta con el siguiente problema: tomando como
4000 X2 desviación estándar de los Xi el valor σ 0 = 0,5 de
la distribución normal, de la cual provienen los datos
Frecuencia
3000 originales, se obtienen valores más pequeños que

las desviaciones estándar de las medias X n
2000
obtenidas por la simulación (ver tabla 1). Para
1000 cumplir la expresión (9), hay que sustituir σ0 por la
desviación estándar s(X) calculada a partir de los
0 valores Xi generados por el redondeo.
Clase -2 -1,5 -1 -0,5 0 0,5 1 1,5 2
4000 n 2 3 5 10
X3 0,2436 0,2479 0,2491 0,2488
3000 Media ( X n )
Frecuencia
s( X n ) 0,4093 0,3322 0,2578 0,1841

2000
s( X )
0,4088 0,3376 0,2556 0,1831
1000 n
σ0
0,3536 0,2887 0,2236 0,1581
0 n
Clase -2,0 -1,0 0,0 1,0 2,0
Tabla 1: Comparación de s( X n ) con s( X ) n y
3000 σ 0 n para X ~ rnd[N(0,25 , 0,5)]. σ 0 = 0,5 y
X5 s(X) = 0,5781 es la desviación estándar calculada
con los datos redondeados obtenidos de la
Frecuencia
2000
simulación.
1000 Evidentemente, el redondeo de los datos

provenientes de la distribución normal incrementa
su desviación estándar. Este efecto puede ser
0 interpretado por la contribución de la discretización
Clase -2,0 -1,0 0,0 1,0 2,0 o “resolución” a la dispersión de los Xi :
2500
X i = µ + δX i + δRi (10)
2000
δX~ N(0, σ0) es la dispersión “original” de los datos
y δR la contribución debido al redondeo. Si σ0 es
Frecuencia
1500 mayor que la resolución R, la dispersión de los Xi

abarca varios intervalos de la resolución y la
1000 distribución del error por el redondeo δR se
aproxima a una uniforme δR~U(-R/2, R/2) con
500 media E (δR ) ≈ 0 y varianza
V (δR ) = E (δR 2 ) ≈ R 2 12 . En consecuencia, la
0 2
-0,5 0,0 0,5 1,0 media E(X) es igual a µ y la varianza s (X) de los Xi
Clase
se obtiene mediante:
Fig. 8: Distribución de las medias X 2 , X 3 y X 5
(arriba) para X ~ rnd[N(0,25 , 0,5)] y comparación de
la distribución de los X 10 (abajo) con una normal
con µ = 0,25 y σ = 0,184 (línea)
5
[ ]
s 2 ( X ) = E ( X − µ )2 = siguen en buena aproximación
2
σ 0 + R 2 12 ,
= E [(δX + δR ) ] = 2 indicado por la línea, para todos los valores de µ ,

(11)
sin embargo para σ 0 < R 12 los valores desvían
= E δX ( )+ 2 ⋅ E (δX ⋅ δR ) + E (δR )
2 2
de este comportamiento, debido a que la
aproximaciones hechas en las ecuaciones (11) y
1,4 Σ εε ρ
Σ ρ ιι εε 11
(12) no son válidas.

µ=0
µ = 0,2
1,3
Ampliación de la
µ = 0,3
gráfica de abajo 7. CONCLUSIONES
µ = 0,4
s(X) / σ0
µ = 0,5
1,2 Se ilustró mediante simulaciones con datos
aleatorios que, de acuerdo al Teorema del Límite
Central, la distribución de la media de un número de
1,1
n datos se aproxima a una distribución normal,
independientemente de la distribución de los datos
1,0 originales y que su desviación estándar disminuye
0,3 0,5 0,7 0,9 1,1 1,3 1,5 por σ n de acuerdo a la ecuación (8). Se
σ0
presentaron estos efectos con datos provenientes
5,0 µ=0 de una distribución uniforme, una distribución
µ = 0,2 Bernoulli una distribución normal y una distribución
4,0 µ = 0,3 normal con redondeo (“resolución”).
µ = 0,4
3,0
µ = 0,5 Adicionalmente, los resultados muestran que el
s(X) / σ0
redondeo de los datos, simulando la resolución de

2,0
un instrumento de medición, incrementa su
desviación estándar de acuerdo a la ecuación (12),
1,0
por lo menos mientras su desviación estándar sea
mayor que la incertidumbre por resolución R 12 .
0,0 Esto indica que la resolución de un instrumento de
0 0,2 0,4 0,6 0,8 1 medición contribuye a la incertidumbre por
σ0
repetibilidad.
Fig. 9: Comportamiento de las desviaciones
estándar s(X) de los datos redondeados En consecuencia, considerando la incertidumbre por
X~rnd[N(µ,σ0)] en relación a σ0 y la comparación resolución por separado en el presupuesto de
con el comportamiento dado por la ecuación (12). incertidumbre, lo cual es una práctica común, lleva a
un conteo doble de ella en la incertidumbre
Si σ0 es significativamente mayor que R 12 la combinada. Una práctica más apropiada puede
considerar en el presupuesto de incertidumbre
distribución de (δX·δR) puede ser considerada como solamente la mayor de las dos incertidumbres por
aproximadamente simétrica, resultando en una repetibilidad o resolución, como lo propone por
media E (δX ⋅ δR ) ≈ 0 , así que finalmente resulta: ejemplo [2].
2 R2
s( X ) ≈ σ0 + (12) REFERENCIAS
12
Este resultado se verificó mediante simulaciones [1] Guide to the Expression of Uncertainty in
numéricas, generando datos X ~ rnd[N(µ,σ0)]. con Measuremants, BIPM, IEC, IFCC, ISO, IUPAC,
diferentes σ0 y µ . El resultado se muestra en la IUPAP, OIML, 1995
[2] Geometrical product specifications (GPS) –
figura 9. Se observa que para σ 0 > R 12 = 1 12 Inspection by measurement of workpieces and
(línea vertical) las desviaciones estándar s(X) measuring equipment, Part 2, ISO/TR 14253-2

Ta-129 - Distribucion

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Ta-129 - Distribucion

Cargado por

Copyright:

Formatos disponibles

Simposio de Metrología 2004 25 al 27 de Octubre

DISTRIBUCIÓN DE LA MEDIA Y EL TEOREMA DEL LÍMITE CENTRAL

1. INTRODUCCIÓN convolución Y también será normal. Sin embargo,

Con simulaciones numéricas se muestra para

3. DISTRIBUCIÓN NORMAL: Xi ~ N(0, 1) 0

En el primer ejemplo se consideran datos Xi -3 - - - - -0

1600 4. DISTRIBUCIÓN UNIFORME: Xi ~ U(0, 1)

X2 A continuación se desarrolla el ejercicio con datos

entre 0 y 1. La figura 4 muestra la distribución de Xi ,

Clase Como siguiente ejemplo se desarrolla el ejercicio

Fig. 3:.Distribución de las medias X 2 , X 3 , X 5 y

6000 La figura 5 muestra la distribución de Xi y la figura 6

3000 acercan a una normal y que las desviaciones

Clase Como último ejemplo se desarrolla el caso de datos

2000 instrumento con resolución de 1 unidad 1.

1000 Con la selección de los parámetros de µ = 0,25 y

Clase limita a los valores -1, 0, 1, y 2 con una distribución

1000 Fig. 7: Distribución de los Xi provenientes de una

3000 originales, se obtienen valores más pequeños que

s( X n ) 0,4093 0,3322 0,2578 0,1841

1000 Evidentemente, el redondeo de los datos

1500 mayor que la resolución R, la dispersión de los Xi

= E [(δX + δR ) ] = 2 indicado por la línea, para todos los valores de µ ,

(12) no son válidas.

redondeo de los datos, simulando la resolución de

También podría gustarte