Está en la página 1de 6

Simposio de Metrología 2004 25 al 27 de Octubre

DISTRIBUCIÓN DE LA MEDIA Y EL TEOREMA DEL LÍMITE CENTRAL


Wolfgang A. Schmid
Centro Nacional de Metrología
Tel.: (442) 211 0554, e-mail: wschmid@cenam.mx

Resumen: De acuerdo al Teorema del Límite Central, la distribución de la media X de una serie de
mediciones repetidas (X1, X2, … Xn) se aproxima a una distribución normal, independientemente de la
distribución de los datos originales xi . Este resultado importante para la estimación de la incertidumbre en
mediciones se prueba con datos aleatorios provenientes de diferentes distribuciones. En particular, se
analiza el caso de datos medidos con un instrumento con resolución “burda” y la interacción entre la
dispersión de los datos cuantificada por su desviación estándar y la resolución del instrumento en la
incertidumbre combinada. Se observa un incremento de la dispersión de los datos como efecto del redondeo,
que con los conceptos de metrología se interpreta como una combinación de las incertidumbres por
repetibilidad y resolución.

1. INTRODUCCIÓN convolución Y también será normal. Sin embargo,


aún si las distribuciones de Xi no son normales, la
El mejor estimado de una magnitud X con un error distribución de Y frecuentemente se puede
asociado que varía de forma aleatoria generalmente aproximar mediante una distribución normal debido
es la media X de un número n de mediciones al Teorema del Límite Central. Este teorema
independientes Xi realizadas bajo las mismas establece que la distribución de Y será
condiciones: aproximadamente normal con esperanza
N N
1 n ) y varianza V (Y ) = ∑ ci 2 ⋅ V ( X i )
X = ⋅ ∑ Xi (1) E (Y ) = ∑ c E( Xi i
n i =1 i =1 i =1
donde E ( X i ) es la esperanza de Xi y V ( X i ) es la
La incertidumbre u de X se estima mediante la varianza de Xi , si las Xi son independientes y V (Y )
desviación estándar experimental de la media: es mucho más grande que cualquier componente
individual ci ⋅ V ( X i ) de una Xi cuya distribución no
( )2
n
s( X i ) 1 es normal.”
u A ( X ) = s( X ) = = ⋅ ∑ Xi − X (2)
n n ⋅ (n − 1) i =1
En el caso de una serie de mediciones repetidas
(X1, X2, … Xn), el Teorema del Límite Central es
donde s(Xi) es la desviación estándar experimental
de las mediciones individuales. El índice A indica aplicable a la media X donde ci = 1 n
que se trata de un “método tipo A” para estimar la n
1
incertidumbre. X =∑ ⋅ Xi (3)
i =1 n
Para determinar el nivel de confianza relacionado
con la incertidumbre de una magnitud, es necesario con la particularidad que todas las Xi provienen de
conocer su distribución. Del Teorema del Límite la misma distribución con la misma esperanza
Central resulta que la distribución de la media X de E ( X i ) = µ y varianza V ( X i ) = σ 2 .
una serie de mediciones repetidas e independientes
(X1, X2,…Xn) se aproxima a una distribución normal, Para la esperanza y varianza de X resulta:
independientemente de la distribución de los Xi . n
1
E( X ) = ∑ ⋅ E( X i ) = µ (4)
i =1 n
Para resaltar esto, véase por ejemplo [1], G.2.1.:
N
2
“Si Y = c 1 X 1 + c 2 X 2 + ...c N X N = ∑
i =1
ci X i y todas n
 1
V ( X ) = ∑   ⋅V ( X i ) =
σ2
(5)
las Xi se caracterizan mediante distribuciones i =1  n  n
normales, entonces la distribución resultante de la

1
Simposio de Metrología 2004 25 al 27 de Octubre

2. DESARROLLO 1500

Con simulaciones numéricas se muestra para


diferentes tipos de distribución de los Xi la 1000

Frecuencia
aproximación de la distribución de la media X n de
n mediciones repetidas a una distribución normal.
500
En hojas de cálculo de Excel se generan 10 000
juegos de datos aleatorios Xki, (i = 1,... 10; k = 1,...
10 000) simulando de esta manera 10 000 ciclos de 0
la medición. Después se calculan las medias para
cada uno de los 10 000 ciclos (con índice k)

9
,1

,5

,9

,3

,7

,1
0,

1,

1,

2,

2,
-3

-2

-1

-1

-0

-0
Clase
1 n
( X n )k = ⋅ ∑ X ki (6)
n i =1 Fig. 1: Histograma los Xi ~ N(0, 1)
1500
para n = 2, 3, 5 y 10 y se generan histogramas de
X2
frecuencia para ver las distribuciones de los X n .
1000

Frecuencia
Las desviaciones estándar de los X n

500
10 000
s( X n ) =
1
(
⋅ ∑ µ − ( X n )k
10 000 k =1
)2
(7)
0
,1 2,5 1,9 1,3 0,7 ,1 0,5 1,
1
1,
7
2,
3
2,
9

9
,1

,5

,9

,3

,7

,1
-3 - - - - -0

0,

1,

1,

2,

2,
se comparan con los valores teóricos que se
-3

-2

-1

-1

-0

-0
Clase
esperan de acuerdo a (5): 1500

σ X3
V ( Xn ) = (8) 1000
Frecuencia

n
donde σ es la desviación estándar de los Xi .
500

3. DISTRIBUCIÓN NORMAL: Xi ~ N(0, 1) 0


,1 2,5 1,9 1,3 0,7 ,1 0,5 1,
1
1,
7
2,
3
2,
9
5

9
,1

,5

,9

,3

,7

,1

En el primer ejemplo se consideran datos Xi -3 - - - - -0


0,

1,

1,

2,

2,
-3

-2

-1

-1

-0

-0

Clase
provenientes de una distribución normal con µ = 0
1400
y σ = 1.
1200
X 10
La figura 1 muestra la distribución de los datos 1000
generados Xi , la figura 2 las distribuciones de X 2 y
Frecuencia

800
X 3 y la de X 10 y una comparación con una normal.
600
Como se espera, las distribuciones de las X n se
400
parecen a distribuciones normales. Un incremento
en n genera distribuciones más estrechas, lo cuál se 200
observa de forma cuantitativa mediante las
0
desviaciones estándar s( X n ) calculadas con los -1,0 -0,5 0,0 0,5 1,0
Clase
10 000 datos de los X n , que siguen la expresión
σ Fig. 2: Distribución de las medias X 2 , X 3 y X 10 y
s( X n ) ≈ (9) comparación con una distribución normal con
n
σ = 1 10 = 0,316 (línea).

2
Simposio de Metrología 2004 25 al 27 de Octubre

1600 4. DISTRIBUCIÓN UNIFORME: Xi ~ U(0, 1)

X2 A continuación se desarrolla el ejercicio con datos


1200
de los Xi provenientes de una distribución uniforme
Frecuencia

entre 0 y 1. La figura 4 muestra la distribución de Xi ,


800
la figura 3 las distribuciones de X 2 , X 3 , X 5 y X 10
400 y una comparación con una distribución normal (en
el caso de X 10 ). Se observa cómo las
0 distribuciones de las X n , incrementando n se
0 1 2 3 4 5 6 7 8 9 1
0, 0, 0, 0, 0, 0, 0, 0, 0, acercan cada vez más a distribuciones normales.
Clase Igual que en el caso anterior, las desviaciones
1600 estándar s( X n ) resultan de acuerdo a la expresión
X3 (9): s( X n ) ≈ 0,289 n
1200
Frecuencia

800 600

500
400
400
Frecuencia
0 300
0 1 2 3 4 5 6 7 8 9 1
0, 0, 0, 0, 0, 0, 0, 0, 0, 200
Clase
100
1600
0
X5
1200
1
2

3
4
5

6
7
8

9
0

1
0,
0,
0,

0,
0,
0,

0,
0,
0,
Frecuencia

Clase
800
Fig. 4: Histograma los Xi provenientes de una
400 distribución uniforme U(0, 1)

0
5. DISTRIBUCIÓN BERNOULLI: Xi ~ B(0, 1)
1

9
0

1
0,

0,

0,

0,

0,

0,

0,

0,

0,

Clase Como siguiente ejemplo se desarrolla el ejercicio


1500 con una distribución Bernoulli, que genera los
valores 0 y 1 con la misma probabilidad de 50%.
1250 X 10
6000
1000
Frecuencia

5000
750
4000
Frecuencia

500
3000
250 2000

0 1000
0,2 0,3 0,4 0,5 0,6 0,7 0,8
Clase 0
1
0

5
6
7
8
1
2
3
4

Fig. 3:.Distribución de las medias X 2 , X 3 , X 5 y


,1

0,
0,
0,
0,
0,
0,
0,
0,

0,
-0

Clase
X 10 en el caso de Xi ~ U(0,1) y la comparación con
una normal con σ = 0,289 10 = 0,091 (línea). Figura 5: Histograma los Xi ~ B(0, 1).

3
Simposio de Metrología 2004 25 al 27 de Octubre

6000 La figura 5 muestra la distribución de Xi y la figura 6


5000 las de X 2 , X 3 , X 5 y X 10 . También en este caso
X2
4000 se observa como las distribuciones de las X n se
Frecuencia

3000 acercan a una normal y que las desviaciones


2000 estándar siguen la expresión (9): s( X n ) ≈ 0,5 n.
1000
6. DISTRIBUCIÓN NORMAL CON
0 RESOLUCIÓN FINITA: X ~ rnd[N(0,25 , 0,5)]
2

4
1

9
0

1
1

0,

0,

0,
0,

0,

0,

0,

0,

0,
,
-0

Clase Como último ejemplo se desarrolla el caso de datos


4000 Xi provenientes de una distribución normal y
redondeados a enteros X ~ rnd[N(µ, σ0)], simulando
3000
X3 de esta forma la medición de datos con errores
aleatorios normalmente distribuidos, utilizando un
Frecuencia

2000 instrumento con resolución de 1 unidad 1.

1000 Con la selección de los parámetros de µ = 0,25 y


σ 0 = 0,5 para la distribución normal y el número
0
limitado de 10 000 datos generados resultó en el
ejemplo analizado que la generación de los datos se
0

1
1

9
,1

0,

0,

0,
0,

0,

0,

0,

0,

0,
-0

Clase limita a los valores -1, 0, 1, y 2 con una distribución


asimétrica a cero. En mediciones reales con un
3000 instrumento de medición con una resolución “burda”
X5 una situación como está es común.
Frecuencia

2000
7000
1000 6000 Xi
5000
0
Frecuencia

4000
0

1
5

9
1

0,

0,

0,

0,

0,

0,

0,

0,

0,
,
-0

Clase
3000
2500
2000
X 10
2000 1000
0
1500
Frecuencia

Clase -2 -1 0 1 2

1000 Fig. 7: Distribución de los Xi provenientes de una


distribución normal redondeada
500 X ~ rnd[N(0,25 , 0,5)] y la función de distribución de
la cuál provienen los datos originales (línea).
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
La figura 7 muestra la distribución de Xi , la figura 8
Clase las distribuciones de X 2 , X 3 , X 5 y X 10 . También
Figura 6: Distribución de las medias X 2 , X 3 , X 5 y en este caso se observa que las distribuciones de
los X n se acercan a una distribución normal.
X 10 en el caso de Xi ~ B(0, 1) y la comparación con
una normal con σ = 0,5 10 = 0,158 (línea)
1
Se usa la notación “rnd” para “redondear a enteros”.

4
Simposio de Metrología 2004 25 al 27 de Octubre

5000
En la verificación de la expresión (9) uno se
enfrenta con el siguiente problema: tomando como
4000 X2 desviación estándar de los Xi el valor σ 0 = 0,5 de
la distribución normal, de la cual provienen los datos
Frecuencia

3000 originales, se obtienen valores más pequeños que


las desviaciones estándar de las medias X n
2000
obtenidas por la simulación (ver tabla 1). Para
1000 cumplir la expresión (9), hay que sustituir σ0 por la
desviación estándar s(X) calculada a partir de los
0 valores Xi generados por el redondeo.
Clase -2 -1,5 -1 -0,5 0 0,5 1 1,5 2

4000 n 2 3 5 10
X3 0,2436 0,2479 0,2491 0,2488
3000 Media ( X n )
Frecuencia

s( X n ) 0,4093 0,3322 0,2578 0,1841


2000
s( X )
0,4088 0,3376 0,2556 0,1831
1000 n
σ0
0,3536 0,2887 0,2236 0,1581
0 n
Clase -2,0 -1,0 0,0 1,0 2,0
Tabla 1: Comparación de s( X n ) con s( X ) n y
3000 σ 0 n para X ~ rnd[N(0,25 , 0,5)]. σ 0 = 0,5 y
X5 s(X) = 0,5781 es la desviación estándar calculada
con los datos redondeados obtenidos de la
Frecuencia

2000
simulación.

1000 Evidentemente, el redondeo de los datos


provenientes de la distribución normal incrementa
su desviación estándar. Este efecto puede ser
0 interpretado por la contribución de la discretización
Clase -2,0 -1,0 0,0 1,0 2,0 o “resolución” a la dispersión de los Xi :

2500
X i = µ + δX i + δRi (10)

2000
δX~ N(0, σ0) es la dispersión “original” de los datos
y δR la contribución debido al redondeo. Si σ0 es
Frecuencia

1500 mayor que la resolución R, la dispersión de los Xi


abarca varios intervalos de la resolución y la
1000 distribución del error por el redondeo δR se
aproxima a una uniforme δR~U(-R/2, R/2) con
500 media E (δR ) ≈ 0 y varianza
V (δR ) = E (δR 2 ) ≈ R 2 12 . En consecuencia, la
0 2
-0,5 0,0 0,5 1,0 media E(X) es igual a µ y la varianza s (X) de los Xi
Clase
se obtiene mediante:
Fig. 8: Distribución de las medias X 2 , X 3 y X 5
(arriba) para X ~ rnd[N(0,25 , 0,5)] y comparación de
la distribución de los X 10 (abajo) con una normal
con µ = 0,25 y σ = 0,184 (línea)

5
Simposio de Metrología 2004 25 al 27 de Octubre

[ ]
s 2 ( X ) = E ( X − µ )2 = siguen en buena aproximación
2
σ 0 + R 2 12 ,

= E [(δX + δR ) ] = 2 indicado por la línea, para todos los valores de µ ,


(11)
sin embargo para σ 0 < R 12 los valores desvían
= E δX ( )+ 2 ⋅ E (δX ⋅ δR ) + E (δR )
2 2
de este comportamiento, debido a que la
aproximaciones hechas en las ecuaciones (11) y
1,4 Σ εε ρ
Σ ρ ιι εε 11

(12) no son válidas.


µ=0
µ = 0,2
1,3
Ampliación de la
µ = 0,3
gráfica de abajo 7. CONCLUSIONES
µ = 0,4
s(X) / σ0

µ = 0,5
1,2 Se ilustró mediante simulaciones con datos
aleatorios que, de acuerdo al Teorema del Límite
Central, la distribución de la media de un número de
1,1
n datos se aproxima a una distribución normal,
independientemente de la distribución de los datos
1,0 originales y que su desviación estándar disminuye
0,3 0,5 0,7 0,9 1,1 1,3 1,5 por σ n de acuerdo a la ecuación (8). Se
σ0
presentaron estos efectos con datos provenientes
5,0 µ=0 de una distribución uniforme, una distribución
µ = 0,2 Bernoulli una distribución normal y una distribución
4,0 µ = 0,3 normal con redondeo (“resolución”).
µ = 0,4

3,0
µ = 0,5 Adicionalmente, los resultados muestran que el
s(X) / σ0

redondeo de los datos, simulando la resolución de


2,0
un instrumento de medición, incrementa su
desviación estándar de acuerdo a la ecuación (12),
1,0
por lo menos mientras su desviación estándar sea
mayor que la incertidumbre por resolución R 12 .
0,0 Esto indica que la resolución de un instrumento de
0 0,2 0,4 0,6 0,8 1 medición contribuye a la incertidumbre por
σ0
repetibilidad.
Fig. 9: Comportamiento de las desviaciones
estándar s(X) de los datos redondeados En consecuencia, considerando la incertidumbre por
X~rnd[N(µ,σ0)] en relación a σ0 y la comparación resolución por separado en el presupuesto de
con el comportamiento dado por la ecuación (12). incertidumbre, lo cual es una práctica común, lleva a
un conteo doble de ella en la incertidumbre
Si σ0 es significativamente mayor que R 12 la combinada. Una práctica más apropiada puede
considerar en el presupuesto de incertidumbre
distribución de (δX·δR) puede ser considerada como solamente la mayor de las dos incertidumbres por
aproximadamente simétrica, resultando en una repetibilidad o resolución, como lo propone por
media E (δX ⋅ δR ) ≈ 0 , así que finalmente resulta: ejemplo [2].

2 R2
s( X ) ≈ σ0 + (12) REFERENCIAS
12

Este resultado se verificó mediante simulaciones [1] Guide to the Expression of Uncertainty in
numéricas, generando datos X ~ rnd[N(µ,σ0)]. con Measuremants, BIPM, IEC, IFCC, ISO, IUPAC,
diferentes σ0 y µ . El resultado se muestra en la IUPAP, OIML, 1995
[2] Geometrical product specifications (GPS) –
figura 9. Se observa que para σ 0 > R 12 = 1 12 Inspection by measurement of workpieces and
(línea vertical) las desviaciones estándar s(X) measuring equipment, Part 2, ISO/TR 14253-2

También podría gustarte