Está en la página 1de 12

Teora de Errores

Malagn Martnez Sal


Laboratorio 1, Grupo 5FV2, IPN-ESFM
Correo electrnico: sark_blues_friki95@hotmail.com

I. Resumen
Se expuso como recordatorio el tema de teora de errores, haciendo nfasis en los conceptos utilizados
en la fsica experimental como son medicin, mensurando, errores de medicin y propagacin de
errores al realizar clculos sobre los datos medidos. Tambin se analizaron distintos temas sobre
probabilidad y estadstica con son medidas de tendencia central, medidas de dispersin y las
representaciones grficas de los datos, tanto histogramas como ojivas. Por ltimo se trat la forma de
ajustar los datos obtenidos experimentalmente para observar el comportamiento de la grfica que
forman.

II. Introduccin

Medicin: Es la comparacin que se establece entre una cierta cantidad y su correspondiente unidad,
para determinar cuntas veces dicha unidad es proporcional a la cantidad en cuestin.

Mensurando: Es una magnitud particular que es sometida a una medicin.

Medidas de tendencia central

1.- Media aritmtica


La media representa un centro geomtrico del conjunto de medidas, y se calcul por medio de:
N

xi
i=1
x =
N

En caso de que los valores de xi aparezcan repetidos se siguen las siguientes expresiones:
N

xi ni N
x = x i f i
i=1
x = o
N i=1

Donde ni son las frecuencias absolutas de xi, y fi son las frecuencias relativas fi = ni/N
Para datos agrupados se tiene:
N

ci ni LSLinf
i=1
x = , con c i=
N 2

Donde ci es la marca de clase de intervalo, Ls es el lmite superior del intervalo y Linf es el lmite
inferior del intervalo.
2. Media geomtrica
Esta media tiene la caracterstica negativa de que si uno de los valores es nulo la media sera as mimo
cero, y por lo tanto sera poco representativa del valor central. Adems si existen valores negativos es
posible que no se pueda calcular. En el caso de una muestra con valores diferentes de la variable se
define como:

xG= N x1 x 2 ... x N

Si los datos aparecen agrupados en k valores distintos la definicin sera


N
xG= x1 x 2 ... x k
n1 n2 nk

A la hora de calcularla es til tener en cuenta que:


N

ni log( x i )
log( xG )= i=1
N

3.- Media armnica


Se define como la inversa de la media aritmtica de las inversas de los valores de la variable. Es decir,
para variables no agrupadas y agrupadas, sera

N N
xA= N
; xA= N
n
1x xi
i=1 i i=1 i

Es evidente que si una de las medidas es 0, la media armnica no tiene sentido.

4.- Media cuadrtica


Una tercera definicin corresponde a la media cuadrtica, que se define como la raz cuadrada de la
media aritmtica de los cuadrados de los valores.


N k

x2i x2i ni
i=1 i=1
xQ= ; xQ=
N N

5.- Mediana
La mediana se define como una medida central tal que, con los datos ordenados de menor a mayor, el
50% de los datos son inferiores a su valor y el 50 % de los datos tienen valores superiores. Es decir, la
mediana divide en dos partes iguales la distribucin de frecuencias. La mediana es una medida robusta,
siendo muy insensible a valores que se desven mucho. Se distinguen diversos casos para su clculo:

- Los datos no se repiten: En este caso, suponiendo que se tienen los datos ordenados, la mediana ser
el valor central si N es impar, o la media aritmtica de los dos valores centrales si N es par.
- Variable discreta con valores repetidos: Se calcula en primer lugar el nmero de observaciones N
dividido entre 2. Se pueden distinguir entonces 2 casos. El primero cuando dicho valor N/2 coincide
con la frecuencia absoluta acumulada de un valor de la variable (o lo que es lo mismo, cuando la
frecuencia relativa acumulada es 0.5). En este caso la mediana se sita entre este valor de la variable y
el siguiente ya que de esta forma dividir la distribucin de frecuencias en 2. Es decir:

x j+x j+1
M e=
2

Si N/2 no coincidiese con ningn valor de la columna de frecuencias acumuladas, la mediana sera el
primer valor con frecuencia absoluta acumulada mayor que N/2, ya que el valor central de la
distribucin correspondera a una de las medidas englobadas en ese valor.
- Valores agrupados en intervalos de clase: En este caso pueden ocurrir dos situaciones. En primer
lugar, si N/2 coincide con la frecuencia absoluta acumulada de un intervalo, la mediana ser el extremo
superior de ese intervalo. En el caso de que ninguna frecuencia absoluta acumulada coincida con N/2
ser necesario interpolar en el polgono de frecuencias acumuladas. Se supone que el valor N/2 se
encuentra entre las frecuencias absolutas acumuladas Nj-1 y Nj, correspondientes a los intervalos (aj-1, aj)
y (aj, aj+1) respectivamente, la mediana se situar en algn lugar del intervalo superior. Por tanto se
tiene:

a j+1a j M ea j
=
N jN j1 N /2N j1

N /2N j1 N /2N j1
M e =a j+ (a j+1a j )=a j (a j+1 a j)
N jN j1 nj

6.- Moda
Se define la moda de una muestra como aquel valor de la variable que tiene una frecuencia mxima.
Puede suceder que la moda no sea nica, en ese caso se dice que se tiene una distribucin bimodal,
trimodal, etc. En caso de una variable discreta que no tiene valores repetidos la moda no tiene sentido.
Cuando si existen valores repetidos su clculo es directo. En el caso de variables continuas agrupadas
en intervalos de clase existir un intervalo en el que la frecuencia sea mxima, llamado intervalo
modal. Para asociar la moda a un valor determinado de la variable dentro de dicho intervalo modal se
tiene:

n jn j1
M O=a j + (a a )
(n jn j1 )+(n jn j+1 ) j+1 j

Donde (aj, aj+1) es el intervalo modal, es la n j frecuencia absoluta del intervalo modal, n j-1 y nj+1 son la
frecuencia absoluta anterior y posterior respectivamente de nj,
Es decir, la moda estar ms prxima a aj cuanto menor sea la diferencia de frecuencias con el intervalo
anterior, y al revs.

En el caso de que se tuviese una distribucin perfectamente simtrica, las tres medidas de
centralizacin media aritmtica, mediana y moda coincidiran en el mismo valor. Sin embargo, cuando
la distribucin de medidas es claramente asimtrica la mediana se suele situar entre la moda y la media.
Errores

Un error experimental es una desviacin del valor medido de una magnitud fsica respecto al valor real
de dicha magnitud. En general los errores experimentales son ineludibles y dependen bsicamente del
procedimiento elegido y la tecnologa disponible para realizar la medicin.

Si la medida de una magnitud se efecta repetidas veces se obtienen generalmente diversos valores
aunque no muy distintos entre s. Errores grandes son los que afectan a las medidas que se separan
notablemente del conjunto. Errores tolerables son los que perduran una vez excluidos los errores
grandes de la serie de mediciones y dan razn de la diversidad de valores hallados. Pueden atribuirse a
diversas causas y se les clasifica en tres categoras:

Errores sistemticos: influyen de igual manera en todas las mediciones y son muy difciles de
localizar. No aparecen estudiando las medidas hechas y a menudo se ignoran las causas que los
producen. En general provienen de la imperfeccin de las teoras fsicas que sirven de fundamento a las
experiencias o de los instrumentos o de los instrumentos empleados y de ciertas peculiaridades del
observador. Pueden ser de diversos orgenes, a saber:
a) Errores de calibracin de los instrumentos de medida.
b) Errores personales
c) Condiciones experimentales
d) Imperfeccin de tcnica

Errores accidentales: Tambin conocidos como desvos o indeterminaciones, se deben a causas


fortuitas y variables y sus valores estn comprendidos dentro de la aproximacin de los instrumentos.
En una gama de medidas es notable observar la presencia de errores tanto por defecto como por exceso
y de valor variable e impredecible, si bien los pequeos se dan en mayor nmero que los grandes. Entre
ellos se pueden citar:
a) Errores de juicio
b) Condiciones fluctuantes
c) Definicin

Errores aleatorios: este tipo de error se debe a la variable no controlada que son parte inevitable de
toda medicin fsica o qumica.

Existen dos maneras de cuantificar el error de la medida:

Error absoluto: corresponde a la diferencia entre el valor medido y el valor real.

e ab=f mf r

Error relativo: corresponde al cociente entre el error absoluto y el valor real.

f mf r
e rel =
fr
Propagacin de errores

En fsica se estudian diferentes modelos matemticos que intentan explicar de modo aproximado cmo
se comporta la naturaleza e intentan predecir la consecuencia en determinados experimentos. Si el
modelo no falla en sus predicciones se va consolidando poco a poco en la teora fsica. Sin embargo,
desde el momento en que falla se debe abandonar o, como mucho, limitar su aplicabilidad. Sin embargo
tambin pueden ser los experimentos los que fallen. Cuando tomamos datos en un experimento, estos
datos presentan cierta incertidumbre. Cada medida viene con un error intrnseco que en general se
escribe como x x.
Estos errores se tienen que tratar a la hora de realizar los informes de los experimentos y propagarlos a
las cantidades que queramos determinar a partir de ellos.

Hay dos posibilidades de asignar un error, que las medidas sean directas o, por el contrario, indirectas.
Cuando las medidas son directas vuelve a haber dos posibilidades que se haya realizado una sola
medida o que se hayan realizado varias.

Si se realiza de una sola medida el error que se asigna es la sensibilidad del objeto que se use para
medir o bien un error tal que recoja las fluctuaciones del objeto con la que se est midiendo.

Si se realizan n medidas se emplear como valor real la media aritmtica de todas ellas, aunque no
necesariamente, y para el error se emplear la desviacin tpica del valor medio.

Para calcular medidas indirectas que son funcin de otras se actuar de la siguiente manera. El valor de
la medida no ser otro que la solucin a la funcin, y el valor del error se calcular segn las siguientes
expresiones:

Si las variables fueron medidas una sola vez


n
f
f (x 1 , ... , x n )= xi
i=1 xi

Si las variables fueron medidas varias veces


n 2
f
(f ( x 1 ,... , xn ))= (
2 2
) ( x i)
i=1 xi

Medidas de dispersin

1.- Desviacin media


Una manera de estimar la dispersin de los valores de la muestra es comparar cada uno de stos con el
valor de una medida de centralizacin. Se define entonces la desviacin media respecto a la media
aritmtica en el caso de que la variable no tome valores repetidos, ni est agrupada en intervalos como:
N

|xi x|
Dx = i=1
N
En el caso de una variable discreta con valores repetidos se define como:
k

|xi x| ni
Dx = i=1
N

La importancia de tomar valores absolutos de las desviaciones radica en que si no se hiciese as unas
desviaciones se anularan con otra, alcanzando finalmente la desviacin media un valor de 0.

En ocasiones se define una desviacin media en trminos de desviaciones absolutas en torno a una
medida de centralizacin diferente de la media aritmtica. Cuando se utiliza la mediana se obtiene la
llamada desviacin media respecto a la mediana, definida como
N

|xi M e| ni
D M = i=1
e
N

2.- Varianza
Al igual que la desviacin media, est basada en un valor promedio de las desviaciones respecto a la
media. En este caso, en vez de tomar valores absolutos de las desviaciones, para evitar as que se
compensen desviaciones positivas y negativas, se usan los cuadrados de las desviaciones. Esto hace
adems que los datos con desviaciones grandes influyan mucho en el resultado final.
Se define entonces la varianza de una muestra con datos repetidos como:
k

( x i x )2 n i
s 2= i=1
N 1

En el caso de que los datos no se repitan:


N

( x i x )2
s 2= i=1
N1

3.- Desviacin estndar


Evidentemente la varianza no tiene las mismas unidades que los datos de la muestra. Para conseguir las
mismas unidades se define la desviacin tpica como la raz cuadrada de la varianza.

(x i x )2 ni
s= s2= i=1
N 1

La medida ms usada para estimar la dispersin de los datos es la desviacin tpica o estndar. Esta es
especialmente aconsejable cuando se usa la media aritmtica como medida de tendencia central.
En el caso de que los datos no se repitan:

N

(x i x )2
s= s2= i=1
N1

En cuanto a las propiedades de la desviacin tpica, es fcil ver que sta ser siempre positiva y slo
tendr un valor nulo cuando todas las observaciones coincidan con el valor de la media. Es decir, la
varianza y por tanto, la desviacin estndar es la mnima desviacin cuadrtica.

Hay que indicar que la desviacin tpica no es una medida robusta de la dispersin. El hecho de que se
calcule evaluando los cuadrados de las desviaciones hace que sea muy sensible a observaciones
extremas.

Representaciones grficas

Cuando el nmero de valores distintos que toma la variable estadstica es demasiado grande o la
variable es continua, es til realizar un agrupamiento de los datos en intervalos y se hace un recuento
del nmero de observaciones que caen dentro de cada uno de ellos. Dichos intervalos se denominan
intervalos de clase, y al valor de la variable en el centro de cada intervalo se le llama marca de clase.
De esta manera sustituye cada medida por la marca de clase del intervalo a que corresponda. A la
diferencia entre el extremo superior e inferior de cada intervalo se le llama amplitud del intervalo.
El realizar el estudio mediante el agrupamiento en intervalos de clase simplifica el trabajo pero
tambin supone una prdida de informacin, ya que no se tiene en cuenta cmo se distribuyen los datos
dentro de cada intervalo. Para que dicha prdida sea mnima es necesario elegir con cuidado los
intervalos. Aunque no existe ningunas reglas estrictas para la eleccin de los intervalos, los pasos a
seguir son:

1.- Determinar el recorrido, o rango, de los datos. Esto es, la diferencia entre el mayor y el menor de los
valores que toma la variable.
2.- Decidir el nmero k de intervalos de clase en que se van a agrupar los datos. Dicho nmero se debe
situar normalmente entre 6 y 20, dependiendo del caso. En general el nmero ser ms grande cuanto
ms datos tenga la muestra. Una regla que a veces se sigue es elegir k como el entero ms prximo a
N, donde N es el nmero total de medidas.
3.- Dividir el recorrido entre el nmero de intervalos para determinar la amplitud (constante) de cada
intervalo. Dicha amplitud no es necesario que sea exactamente el resultado de esa divisin, sino que
normalmente se puede redondear hacia un nmero algo mayor.
4.- Determinar los extremos de los intervalos de clase. Evidentemente el extremo superior de cada
intervalo ha de coincidir con el extremo inferior del siguiente. Es importante que ninguna observacin
coincida con alguno de los extremos, para evitar as un ambigedad en la clasificacin de este dato.
Una forma de conseguir esto es asignar a los extremos de los intervalos una cifra decimal ms que las
medidas de la muestra. Por ejemplo, si la variable estadstica toma valores enteros: 10, 11, 12, ..., los
intervalos se podran elegir: 9.5 11.5, 11.5 13.5,...
5.- Calcular las marcar de clase de cada intervalo como el valor medio entre los lmites inferior y
superior de cada intervalo de clase. Otra consideracin a tomar en cuenta a la hora de elegir los
intervalos es intentar que las marcas de clase coincidan con medidas de la muestra, disminuyndose as
la prdida de informacin debida al agrupamiento.

Una vez determinados los intervalos se debe hacer un recuento cuidadoso del nmero de
observaciones que caen dentro de cada intervalo, para construir as la tabla de frecuencias.
1.- Histograma

Un histograma es un conjunto de rectngulos adyacentes, cada uno de los cuales representa un


intervalo de clase. La base de cada rectngulo es proporcional a la amplitud del intervalo. Es decir, el
centro de la base de cada rectngulo ha de corresponder a una marca de clase. La altura se suele
determinar para que el rea de cada rectngulo sea igual a la frecuencia de la marca de clase
correspondiente. Por tanto, la altura de cada rectngulo se puede calcular como el cociente entre la
frecuencia (absoluta o relativa) y la amplitud del intervalo. En el caso de que la amplitud de los
intervalos sea constante, la representacin es equivalente a usa como altura la frecuencia de cada marca
de clase.

2.- Ojiva

Para representar las frecuencias, tanto absolutas como relativas, acumuladas se usa el diagrama de
frecuencias acumuladas u ojiva. Este grfico, en forma de escalera, se construye representando en
abscisas los distintos valores de la variable y levantando sobre cada valor una perpendicular cuya
longitud ser la frecuencia acumulada (absoluta o relativa) de ese valor. Los puntos se unen con tramos
horizontales y verticales. Evidentemente la escalera resultante ha de ser siempre ascendente.

Ajuste por mnimos cuadrados

El procedimiento ms objetivo para ajustar una recta a un conjunto de datos presentados en un


diagrama de dispersin se conoce como el mtodo de los mnimos cuadrados. La recta resultante
presenta dos caractersticas importantes:

1.- La suma de los cuadrados de las desviaciones verticales de los puntos a partir de la recta de ajuste es
0.

( y y aj )2 0
2.- La suma de los cuadrados de dichas desviaciones es mnima.

El procedimiento consiste entonces en minimizar los residuos Ci2

C 2i = ( y y aj )2
Reemplazando yaj nos queda

C 2i = [ y (a+bx)]2
La obtencin de los valores de a y b que minimizan esta funcin es un problema que se puede resolver
recurriendo a la derivacin parcial de la funcin en trminos de a y b. Llamemos G a la funcin que se
va a minimizar.

G= ( yabx )2

Tomemos las derivadas parciales de G respecto de a y b que son las incgnita y las igualamos a cero,
de esta forma se obtienen dos ecuaciones, llamadas ecuaciones normales del modelo, que pueden ser
resueltas por cualquier mtodo ya sea igualacin o matrices para obtener los valores de a y b.
Derivamos parcialmente la ecuacin respecto de a

dG
=2 ( yabx )(1)=0
da

2 ( yabx )=0

( yabx )=0
y nab x=0
y =na+b x 1a ecuacin normal

Derivamos parcialmente la ecuacin respecto de b

dG
=2 ( yabx)(x)=0
db

2 ( yabx )( x)=0

( xyxabx 2)=0
y nab x=0
xy=a x+ b x 2 2a ecuacin normal

Los valores de a y b se obtienen resolviendo el sistema de ecuaciones resultante. O tambin de la


siguiente forma:

Partiendo de

y =na+b x
xy=a x+ b x 2
Si dividimos todos los trminos de la ecuacin 1 entre n nos queda:

y = na +b x
n n n

Tenemos entonces que el primer trmino es y promedio, el segundo trmino es la incgnita a y el tercer
trmino es la incgnita b multiplicada por x promedio

y =a+b x
Entonces

a= y b x

Reemplazando a en la ecuacin 2 tenemos

xy=( y b x ) x+ b x 2
Despejando bx

b x 2= xy( y b x ) x

b x 2= xy y x +b x x

Multiplicando y dividiendo por n

n y x n b x x
b x 2= xy +
n n

Como x =x/n, entonces

b x 2= xyn y x +nb x 2

Despejando b

b x 2nb x = xyn y x

b( x2 n x2 )= xy n y x

b=
xy n y x
x 2n x 2
Se debe tener presente la diferencia entre el valor de y aj obtenido con la ecuacin de regresin y el valor
de y observado. Mientras yaj es una estimacin y su bondad en la estimacin depende de lo estrecha
que sea la relacin entre las dos variables que se estudian, y es el valor efectivo, verdadero obtenido
mediante la observacin del investigador.

Error estndar en la estimacin

El error estndar de la estimacin designado por Syx mide la disparidad promedio entre los valores
observados y los valores estimados de yaj . Se utiliza la siguiente formula.

S xy =
( y y aj)2
n2
Como esta medida trata de resumir la disparidad entre lo observado y lo estimado, es decir, trata de
medir la diferencia promedio entre lo observado y lo estimado o esperado de acuerdo al modelo, puede
considerarse como un indicador del grado de precisin con que la ecuacin de regresin describe la
relacin entre las dos variables. Este error estndar se ve afectado por las unidades y sus cambio ya que
es una medida absoluta, pues se da en la misma unidad de medida que est dada la variable y. Es
necesario entonces calcular una medida que interprete o mida mejor el grado de relacin entre las
variables.

Ajuste de un polinomio de grado n

Se quiere aproximar un polinomio de grado n, a un conjunto de m+1 pare de datos, (x i,yi) de modo que
n m.
Sea el polinomio

P( x)=a0 + a1 x +a 2 x 2+ ...+ an x n

Se calcula la cantidad
m m
S= (P ( x i) y i ) = ( a0 +a1 x+ a2 x ++ an x y i)
2 2 n 2

i=0 i=0

Para obtener los valores de los coeficientes del polinomio se tienen que determinar los valores de los
coeficientes a0, a1, a2, ..., an de forma que la cantidad S tome un valor mnimo.

Hagamos las derivadas parciales de S respecto de a0, a1, a2, ..., an iguales a cero (1)
m
1 S
= (a +a x + a x 2 ++ an xin y i)1=0
2 a 0 i=0 0 1 i 2 i

m
1 S
= (a +a x + a x 2 ++ an x in yi )x i=0
2 a 1 i =0 0 1 i 2 i


m
1 S
= ( a0 +a1 x i+ a2 x i2 ++ an xin y i)xin=0
2 a n i=0

Obtenemos un sistema de n+1 ecuaciones con n+1 incgnitas, a0, a1, a2, ..., an

Ahora introduzcamos las expresiones (2)

S k =x k0 +x k1 +x k2 +...+x km k = 0, ..., 2n

k k k k
t k =x 0 y 0+x 1 y 1 +x 2 y 2 +...+ x m y m k = 0, ..., n

Se obtiene entonces el siguiente sistema de n+1 ecuaciones con n+1 incgnitas


a0 s0 +a 1 s1 +a 2 s2 ++ an s n=t 0

a0 s1 +a1 s 2 +a2 s 3 ++ an s n+1=t 1

a0 s2 +a1 s 3 +a2 s 4 + +an s n+ 2=t 2

a0 sn +a 1 sn +1+ a2 s n+2 ++ an s 2n =t n

Si todos los puntos son distintos, el sistema de ecuaciones tiene una solucin nica.

III. Conclusin

Se recordaron las definiciones de la estadstica para la observacin y anlisis de datos, como tambin la
teora de errores para el anlisis correcto de datos experimentales.

IV. Bibliografa

Gorgas Garca Javier, Cardiel Lpez Nicols, Zamorano Calvo Jaime, Estadstica Bsica para
estudiantes de ciencias, Universidad Complutense de Madrid.