Está en la página 1de 151

Estadstica y Programacin aplicada a la Qumica

Introduccin al anlisis de datos experimentales

Dr. Pedro Alberto Enrquez Palma


rea de Qumica Fsica
Departamento de Qumica
Licenciatura en Qumica, Universidad de La Rioja
ndice general

1. Errores, incertidumbres, precision y exactidud. 5


1.1. Errores e incertidumbres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Cifras o digitos significativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3. Ejercicios y problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3.1. Soluciones a los ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4. Lecturas recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2. Teora estadstica de los errores(I). Probabilidad 15


2.1. Definicin de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1.1. El espacio muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1.2. Definicin emprica de probabilidad . . . . . . . . . . . . . . . . . . . . . . 16
2.1.3. Definicin aximtica de probabilidad . . . . . . . . . . . . . . . . . . . . . 18
2.1.4. Probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2. Funciones de distribucin de probabilidad. . . . . . . . . . . . . . . . . . . . . . . . 20
2.2.1. Distribuciones de probabilidad de variables aleatorias discretas. . . . . . . . 21
2.2.2. Distribuciones de probabilidad de variables aleatorias continuas . . . . . . . 24
2.3. Ejercicios y problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3.1. Soluciones a los ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4. Lecturas recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3. Teora estadstica de los errores(II). Esperanza matemtica 33


3.1. Esperanza matemtica de una magnitud aleatoria . . . . . . . . . . . . . . . . . . . 34
3.1.1. Magnitudes aleatorias discretas . . . . . . . . . . . . . . . . . . . . . . . . 34
3.1.2. Magnitudes aleatorias continuas . . . . . . . . . . . . . . . . . . . . . . . . 34
3.1.3. Propiedades de la esperanza matemtica . . . . . . . . . . . . . . . . . . . . 34
3.1.4. Momentos de una distribucin. . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2. Propiedades generales y propiedades muestrales de una magnitud aleatoria . . . . . . 38
3.2.1. Media general de una magnitud aleatoria . . . . . . . . . . . . . . . . . . . 39
3.2.2. Media muestral de una magnitud aleatoria . . . . . . . . . . . . . . . . . . . 39

1
0.0 ndice general

3.2.3. Varianza de una magnitud aleatoria. . . . . . . . . . . . . . . . . . . . . . . 39


3.2.4. Dispersion o varinza muestral de una magnitud aleatoria . . . . . . . . . . . 42
3.3. Mediana y moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.4. Ejercicios y problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.4.1. Soluciones a los ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.5. Lecturas recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

4. Distribuciones de probabilidad de variables aleatorias discretas 49


4.1. Distribucin uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.2. Distribucin binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.2.1. Teorema de Moivre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.3. Distribucin de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.3.1. La distribucin de Poisson como lmite de la distribucin binomial . . . . . . 57
4.3.2. La distribucin de Gaussiana o normal como lmite de la distribucin de Poisson 58
4.4. Ejercicios y problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.4.1. Soluciones a los ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.5. Lecturas recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5. Distribuciones de probabilidad de variables aleatorias continuas 67


5.1. Distribucin uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.2. Distribucin normal o Gaussiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.2.1. Qu variables aleatorias siguen una distribucin normal? . . . . . . . . . . 75
5.3. La distribucin t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.3.1. Qu variables aleatorias siguen una distribucin t de Student? . . . . . . . . 81
5.4. La distribucin 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.4.1. Qu variables aleatorias siguen una distribucin 2 ? . . . . . . . . . . . . 84
5.4.2. Relacin entre la distribucin 2 y la distribucin normal . . . . . . . . . . . 87
5.5. La distribucin F de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5.5.1. Qu variables aleatorias de inters siguen una distribucin F de Fisher? . . . 88
5.6. Ejercicios y problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.6.1. Soluciones a las cuestiones . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.6.2. Soluciones a los ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.7. Lecturas recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

6. Intervalos de probabilidad e intervalos de confianza 105


6.1. Distribucin de probabilidad del error aleatorio. . . . . . . . . . . . . . . . . . . . . 106
6.2. Intervalos de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.2.1. Definicin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.2.2. Intervalos de probabilidad de las medidas . . . . . . . . . . . . . . . . . . . 107
6.2.3. Intervalos de probabilidad de las medias . . . . . . . . . . . . . . . . . . . . 108
6.2.4. Intervalos de probabilidad de las varianzas . . . . . . . . . . . . . . . . . . 108
6.3. Intervalos de confianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.3.1. Definicin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.4. Calculo de intervalos de confianza para la media . . . . . . . . . . . . . . . . . . . . 113
6.4.1. Datos distribuidos normalmente con varianza 2 (x) conocida . . . . . . . . 113

2
0 ndice general

6.4.2. Datos distribuidos normalmente con varianza finita y con n grande . . . . . . 113
6.4.3. Datos distribuidos normalmente con varianza 2 (x) desconocida . . . . . . . 114
6.4.4. Datos que siguen una distribucin desconocida con varianza finita y con n
pequea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
6.5. Calculo de intervalos de confianza para la varianza . . . . . . . . . . . . . . . . . . 116
6.6. Clculo de intervalos de confianza para la diferencia de las medias . . . . . . . . . . 117
6.6.1. Datos distribuidos normalmente con varianzas 12 (x) y 22 (y) conocidas . . . 118
6.6.2. Datos distribuidos normalmente con varianzas 12 (x) y 22 (y) desconocidas
pero iguales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.6.3. Datos que siguen cualquier distribucin con varianza finita y con n1 y n2
grandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.6.4. Datos distribuidos normalmente con varianzas 12 (x) y 22 (y) desconocidas y
distintas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
6.7. Anlisis de datos emparejados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
6.8. Ejercicios y problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
6.9. Lecturas recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

7. Clculo de errores 131


7.1. Clculo de errores en medidas directas . . . . . . . . . . . . . . . . . . . . . . . . . 132
7.1.1. Errores de escala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
7.1.2. Errores de sistemticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
7.1.3. Errores accidentales o aleatorios . . . . . . . . . . . . . . . . . . . . . . . . 132
7.2. Desestimacin de medidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.2.1. El ensayo de la Q de Dixon . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.2.2. La tcnica de la de Thompson modificada . . . . . . . . . . . . . . . . . . 136
7.3. Clculo de errores de medidas indirectas . . . . . . . . . . . . . . . . . . . . . . . . 138

I Apndices 141
A. Tablas estadsticas 143
A.1. rea bajo la curva normal tipificada . . . . . . . . . . . . . . . . . . . . . . . . . . 143
A.2. Valores de las percentilas tp para un distribucin t de Student con grados de lbertad 145
A.3. Valores de las percentilas 2p para un distribucin 2 de Student con grados de lbertad146
A.4. Valores de las percentilas F0,95 (1 , 2 ) para un distribucin F . . . . . . . . . . . . . 147
A.5. Valores de las percentilas F0,99 (1 , 2 ) para un distribucin F . . . . . . . . . . . . . 148

3
0.0 ndice general

4
1

Errores, incertidumbres, precision y exactidud.

Contenidos Errores e incertidumbres. Concepto de error. Tipos de errores. Error


de escala y resolucin. Exactitud y precisin.
Cifras y dgitos significativos. Normas de redondeo y truncamiento.

Objetivos Errores e incertidumbre

Comprender el concepto de error

Distinguir entre los errores sistemticos y aleatorios

Reconocer el error de escala

Comprender los conceptos de precisin, exactitud y sesgo

Cifras significativas

Determinar el nmero de cifras significativas de un nmero

Escribir correctamente un nmero en notacin cientfica

Redondear correctamente un resultado

5
1.1 1.1. Errores e incertidumbres

1.1. Errores e incertidumbres


En la determinacin experimental de una magnitud no podemos definir error como la diferencia
entre el valor observado de la magnitud y su valor real: no conocemos este supuesto valor real slo
disponemos de aproximaciones a ese valor obtenidas en otros experimentos o a partir de predicciones
tericas. Sin embargo, podemos acotar el intervalo de valores que puede asumir esa magnitud al
realizar la medida.
Suponga que conocemos el valor real del observable1 , A. A la diferencia entre el valor del obser-
vable A y el valor obtenido en la medida, ai , la denominaremos error absoluto, ei :

ei = |A ai | (1.1)
Como es imposible determinar A, no podemos determinar ei . Lo que si podemos hacer es estimar
el intervalo de valores en que esperamos encontrar A de modo que la diferencia entre la medida, ai , y
A sea menor o igual que un cierto error, i :

i = |A ai | (1.2)

A ai i A + ai (1.3)
As, es conveniente representar el valor real que intentamos aproximar (y no conocemos) con un
intervalo centrado en la medida ai :

A = ai i (1.4)

i es el error absoluto o incertidumbre de la medida.


Podemos distinguir tres tipos de contribuciones a la disparidad entre las observaciones experimen-
tales y el valor real:

errores ilegtimos

errores sistemticos

errores aleatorios

Los errores ilegtimos2 son aquellos causados por errores de clculo o en la realizacin del expe-
rimento. Afortunadamente estos son fcilmente detectables, ya sea porque el resultado de la medida
es un valor fsicamente improbable o porque los resultados difieren considerablemente de otras deter-
minaciones. Estos errores se corrigen repitiendo las operaciones erroneas o el experimento.
Los errores sistemticos (o determinados) son aquellos que afectan a las distintas medidas de un
modo previsible. Su determinacin no es siempre fcil, puesto que no siempre es posible estimar su
efecto y slo pueden detectarse mediante un anlisis detallado del procedimiento experimental. Si el
tipo y magnitud de este error es conocido, la medida puede ser corregida para compensar por este
1
observable: propiedad que puede medirse experimentalmente
2
Tambin llamados errores groseros o accidentales

6
1 1.Errores, incertidumbres, precision y exactidud.

error. En otros casos la incertidumbre asociada a este efecto ha de ser estimada y combinada con
aquella asociada a los errores aleatorios.

Un caso particular de error sistemtico es el error de escala. Este resulta de la capacidad limitada,
resolucin, para distinguir dos valores muy prximos de la magnitud medida. La resolucin es por
tanto una caracterstica del instrumento y siempre tiene un valor distinto de cero. Salvo que el cons-
tructor indique lo contrario, su valor puede estimarse como un medio de la unidad que corresponde
a las divisiones ms prximas de la escala (lectura analgica) o a los cambios ms pequeos de un
contador (lectura digital).

Ejemplo 1. Error de escala


Considere un termmetro con una graduacin en divisiones de decimas de grado. El error de
escala puede estimarse como en 0.05 o C.
Este error es constante y afecta a todos las medidas efectuadas. As, si leemos una temperatura
de 36.5 o C, al tener en cuenta la resolucin del termmetro, podemos expresar el valor de la
temperatura como 36.50 0.05 o C. Es decir, la temperatura est comprendida entre 36.45 y
36.55 o C.

Ejemplo 2. Error sistemtico


Para una determinacin de una longuitud se utiliz un metro de aluminio.
Las medidas fueron realizadas a una temperatura de 20 o C, obteniendose una media de las me-
didas de 1.982 m.
Tras completar el experimento se advirti que el metro se habia calibrado a 25 o C y que el
aluminio utilizado tenia un coeficiente de expansin lineal de 0.005 m.o C1 . Es decir, las lecturas
del metro a 20 o C no son correctas.

7
1.2 1.1. Errores e incertidumbres

Pueden corregirse el resultado obtenido?. Para corregir el error tendemos en cuenta como afecta
la temperatura a las medidas del metro:

l(T ) = l(25o C) (1 0,005T )


donde l(T ) es la longitud del metro a distintas temperaturas, y T la temperatura en grados Cel-
sius.
Utilizando esta ecuacin se obtiene que el valor de la longitud es 1.977 0.005 m. Este valor
difiere del valor sin corregir.

Los errores aleatorios (accidentales o indeterminados) son debidos a factores que sufren pequeas
variaciones durante la medida y que hacen que medidas sucesivas de la misma magnitud difieran.
Por ejemplo, el resultado de una pesada en una balanza de precisin puede verse afectado por las
vibraciones del platillo, las vibraciones producidas por otros aparatos presentes en el laboratorio,
etc. En general la fuente de estos errores no es conocida y por su carcter aleatorio pueden tratarse
estadsticamente.
La figura 1.1. muestra el efecto de errores sistemticos y accidentales sobre el resultado de una
medida.
Algunas definiciones relacionadas con los errores son:
exactitud segun la ISO [3] se define como "grado de concordancia entre el resultado de un ensayo y
el valor de referencia aceptado". Tiene en cuenta todas las fuentes de error del experimento.
precisin propiedad relacionada con la magnitud de los errores aleatorios. Cuanto mayor es la preci-
sin, menor es la magnitud de los errores aleatorios.
sesgo medida del error sistemtico. Unas medidas sesgadas tienden a ser mayores o menores que el
valor de referencia.

Ejemplo 3. Precisin y sesgo


La tabla recoge los resultados de volumetras de 10 ml de NaOH 0.1 M con HCl 0.1 M realizadas
por distintos experimentadores. Teniendo en cuenta, la media, desviacin tpica y la distribucin
de los datos podemos describir la exactitud, precisin y sesgo de los datos [3, tabla 1.1].

experimentador volumen (ml) precisin y sesgo


A 10.08 10.11 10.09 10.10 10.12 preciso sesgado
B 9.88 10.14 10.02 9.80 10.21 impreciso insesgado
C 10.19 9.79 9.69 10.05 9.78 impreciso sesgado
D 10.04 9.98 10.02 9.97 10.04 preciso insesgado

En general, los errores sistemticos y accidentales tienen distinta fuentes y pueden ser tratados
independientemente, la incertidumbre de una medida puede expresarse como

total = sistematica + aleatorio (1.5)

8
1 1.Errores, incertidumbres, precision y exactidud.

Figura 1.1: Comparacin de errores sistemticos y accidentales. Los errores sistemticos estn asocia-
dos con la exactitud de la medida mientras que los errores accidentales o aleatorios con su precisin.

Figura 1.2: Distribucin de las medidas de la tabla del ejemplo 3 [3, figura1]

9
1.2 1.2. Cifras o digitos significativos

1.2. Cifras o digitos significativos


Para indicar el valor de una magnitud experimental se han de proporcionar el mximo nmero de
cifras significativas que permita la precisin del experimento.
Cualquier nmero en valor absoluto puede expresarse como una serie de potencias


X
|x| = i 10m (1.6)
m=i

donde m es un dgito del 0 al 9, e i es un entero tal que

|x|
1 10 (1.7)
10i
Las cifras significativas se definen como:

1. el dgito menos significativo es aquel no nulo ms a la izquierda

2. el dgito ms significativo es aquel ms a la derecha que tenga el mismo orden de magnitud que
la incertidumbre del experimento

3. el nmero total de dgitos significativas comprende todos aquellos que van del dgito ms al
menos significativo

Ejemplo 4. Nmero de cifras significativas


Cuantas cifras significativas tiene el nmero 0, 00370?.
En el nmero 0, 00370 los tres primeros dgitos no son significativos puesto que slo sirven para
indicar el orden de magnitud de la medida.
El ltimo cero si es significativo puesto que el nmero 0,00370 es diferente a 0, 00369, 0, 00371,
0, 00372, . . . . El nmero tiene 3 cifras significativas.
Note que 0,00370 es diferente a 0,0037 porque este nmero slo tiene dos cifras significativas.

Una consecuencia del resultado del ejemplo anterior es que hay que tener cuidado cuando escribi-
mos el resultado de una medida en distintas unidades. Hay que tener cuidado con el nmero de cifras
significativas. Por ejemplo, el equivalente en gramos de 3,2 Kg es 3,2 103 g no 3200 g. Esta nmero
no es correcto puesto que supondra que el resultado del peso en Kg lo conocemos con cuatro cifras
significativas.
Un mtodo que evita ambigedades a la hora de determinar que cifras son significativas es expre-
sar los nmeros en notacin cientfica. En esta notacin el nmero se expresa como el producto de
otro nmero (mantisa) que contiene las cifras significativas, la primera de las cuales ocupa la columna
de las unidades, por una potencia de diez.

10
1 1.Errores, incertidumbres, precision y exactidud.

Ejemplo 5. Notacin cientfica


El nmero 150000 puede expresarse en notacin cientfica como

1.5 105 si tiene dos cifras significativas.

1.50 105 si tiene tres cifras significativas.

1.500 105 si tiene cuatro cifras significativas.

Cuando una magnitud se calcula con un nmero de cifras superior al de cifras significativas con-
viene suprimir las no significativas. A este procedimiento se le denomina redondeo. Al suprimir estas
se introduce un error (error de truncamiento) que afectar a las operaciones en las que se incluya esta
magnitud. Este error ha de minimizarse, e intentar mantenerlo por debajo de la incertidumbre de la
medida. Para ello seguiremos las reglas siguientes:

1. Si el primer dgito despreciado es menor que 5 no se modifica el dgito ms significativo.

2. Si el primer dgito despreciado es mayor que 5 se suma uno al dgito ms significativo.

3. Si el primer dgito despreciado es 5, suma uno al dgito ms significativo si ste es impar; no se


modifica en caso contrario. Aunque esta regla parezca arbitraria, se puede demostrar que de no
usarse esta u otra similar, induciramos un error sistemtico.

Otra regla a tener en cuenta al determinar las cifras significativas supone que si no se proporciona
ningn dato relativo a la incertidumbre de la medida consideramos que todas sus cifras son signi-
ficativas y que estas son el mayor nmero que se puede leer con la escala del aparato usado en la
medida.

Ejemplo 6. Redondeo y truncamiento


Redondee los siguientes nmero al nmero de cifras significativas adecuado:

7,56128 0,02 7,56 0,02


7,56128 0,1 7,6 0,1
1,2451 0,01 1,24 0,01
1,245 0,01 1,24 0,01
1,235 0,01 1,24 0,01
413,73500 0,05 (4,1374 0,0005)102

11
1.3 1.3. Ejercicios y problemas

1.3. Ejercicios y problemas


Errores

Cuestin 1.1 Verdadero o falso.


Los errores aleatorios de una medida son impredecibles. Sin embargo, la media de estos errores
es cero.

Cuestin 1.2 Verdadero o falso.


Los errores sistemticos de una medida pueden permanecer constantes o variar de una manera
predecible (aunque no conozcamos la forma de esa variacin).

Cuestin 1.3 Verdadero o falso.


Los errores sistemticos no pueden eliminarse calculando la media de un conjunto de medidas.

Cuestin 1.4 Eliga la respuesta adecuada


Cuando se resta el blanco a una serie de medidas se intenta eliminar una fuente de error aleato-
rio|sistemtico|escala.

Ejercicio 1.1 Una muestra patrn de suero sanguneo humano contiene 42.0 g de albmina por litro.
Cinco laboratorios (A-E) realizan cada uno seis determinaciones (en el mismo da) de la concentra-
cin de albmina, con los siguientes resultados (en gl1 ):

laboratorio concentracin de albumina, gl1


A 42.5 41.6 42.1 41.9 41.1 42.2
B 39.8 43.6 42.1 40.1 43.9 41.9
C 43.5 42.8 43.8 43.1 42.7 43.3
D 35.0 43.0 37.1 40.5 36.8 42.2
E 42.2 41.6 42.0 41.8 42.6 39.0

Comentar el sesgo, precisin y exactitud de cada uno de estos conjuntos de resultados.


[3, Ejercicio 1]

Ejercicio 1.2 Utilizando la misma muestra y el mtodo del ejercicio anterior, el laboratorio A rea-
liza otras seis determinaciones posteriores de la concentracin de albmina, esta vez en seis das
sucesivos. Los valores obtenidos son 41.5, 40.8, 43.3, 41.9, y 41.7 g.l1 . Comentar estos resultados.
[3, Ejercicio 2]

Ejercicio 1.3 Se ha determinado cuatro veces el nmero de lugares de unin por molcula en una
muestra de anticuerpos monoclonados, con resultados de 1.95, 1.95, 1.92 y 1.97.
Comentar el sesgo, precisin y exactidud de estos resultados
[3, Ejercicio 3]

12
1 1.Errores, incertidumbres, precision y exactidud.

Cifras significativas
Cuestin 1.5 Explique la diferencia entre redondeo y trncamiento

Ejercicio 1.4 Indique el nmero de cifras significativas y exprese en notacin cientifica las siguientes
magnitudes:
(a) 12.08 m. (b) 5.43 1012 s1 (c) 0.12 103 cal
(d) 0.0250 g (e) 2500.2 (f) 10.5 10 2 eV

Ejercicio 1.5 A partir de los resultados de un experimento se calculo que el valor de la energa de
ionizacin del rubidio es de 403.028 kJ mol 1 . Por otra parte se estimo que la incertidumbre de
dicho calculo en 0.2 kJmol1 . Indique el resultado con el nmero correcto de cifras significativas.

1.3.1. Soluciones a los ejercicios


Errores
Ejercicio 1.1 Los resultados de la media g.l1 para los laboratorios A-E son: 41.9, 41.9, 43.2, 39.1,
41.5. De aqu:

A - preciso, poco sesgo, media exacta

B - precisin pobre, poco sesgo, media exacta pero no muy fiable

C - preciso pero sesgado a valores altos, exactitud pobre

D - precisin pobre, sesgado a valores bajos, pobre exactitud

E -similar a A, pero el ltimo resultado podra ser un valor anmalo

Ejercicio 1.2 El laboratorio A an muestra poco sesgo, pero la precisin es ms pobre, reflejando
reproducibilidad (es decir, precisin entre das) pero no repetibilidad (precisin dentro de das).

Ejercicio 1.3 El nmero de posiciones de enlace debe ser un nmero entero, 2 en este caso, de
manera que los resultados son precisos, pero sesgados a valores bajos. El sesgo no es importante, ya
que pueden de ducirse dos posiciones de enlace.

Cifras significativas
Ejercicio 1.4 (a) Cuatro cifras significativas. 1.208 101 m.
(b) Tres cifras significativas. 5.43 1012 s1 .
(c) Dos cifras significativas. 1.2 104 cal.
(d) Tres cifras significativas. 2.50 102 g.
(e) Cinco cifras significativas. 2.5002 103 .
(f) Tres cifras significativas. 1.05 103 eV.

Ejercicio 1.5 4,03 0,20 kJ.mol1

13
1.4 1.4. Lecturas recomendadas

1.4. Lecturas recomendadas


Para completar la preparacin de este tema recomendamos la lectura de:

Captulo 1. Introduccin del libro de Miller y Miller[3]. X


El texto es claro y del mismo nivel que el del curso. Aunque el libro est orientado hacia las
aplicaciones de la Quimiometra en Qumica Analtica, los contenidos son de carcter general.

Introduccin del texto de Spiridonov y Lopatkin[7].

Chapter 1. Uncertainties in measurements del libro de Bevington y Robinson[1]

14
2

Teora estadstica de los errores(I). Probabilidad

Contenidos Introduccin. Error aleatorio y probabilidad.


Definicin de probabilidad. Espacio muestral y sucesos. Magnitud
aleatoria discreta y continua. Definicin emprica de probabilidad. Defini-
cin axiomtica de probabilidad.
Funciones de distribucin de probabilidad: variables aleatorias dis-
cretas. Funcin de probabilidad o funcin de frecuencia. Funcin de dis-
tribucin de probabilidad acumulada.
Funciones de distribucin de probabilidad: variables aleatorias
continuas. Funcin de distribucin de probabilidad o de densidad de pro-
babilidad. Funcin de distribucin de probabilidad integrada.
Objetivos Definicin de probabilidadErrores e incertidumbre

Comprender la relacin entre el error aleatorio y la probabilidad

Conocer la definicin axiomtica de probabilidad y las consecuencias


que se derivan de sta

Comprender la relacin entre frecuencia de un suceso y probabilidad de


que este se produzca

Funciones de distribucin de probabilidad

Realizar clculos bsicos de probabilidad para variables aleatorias dis-


cretas

Realizar clculos bsicos de probabilidad para variables aleatorias con-


tinuas

15
2.1 2.1. Definicin de probabilidad

Como vimos en el tema 1, los errores accidentales son debidos a las fluctuaciones de las distintas
variables que influyen sobre el experimento. Esto se manifiesta en que medidas repetidas en condi-
ciones aparentemente idnticas difieren. Por este carcter aleatorio, los errores accidentales pueden
tratarse estadsticamente.
El objetivo de la teora estadstica de los errores es mltiple: obtener una apreciacin ptima del
valor de la magnitud medida, estimar el error accidental en su determinacin, verificar si el resultado
es compatible con determinadas hiptesis que puedan establecerse sobre la magnitud que se mide,
etc.
Toda teora estadstica de los errores se basa en dos postulados generales:
(a) la medida experimental de una magnitud es una variable aleatoria que cumple la ley de estabi-
lidad estadstica o de los grandes nmeros segn la cual las medidas se concentran en torno a un valor
medio, que cuando el nmero de observaciones es grande (en el lmite de infinito) se convierte en un
valor constante, independiente del nmero de observaciones.
(b) la probabilidad de que observemos un valor distinto del valor medio puede caracterizarse
mediante una funcin (funcin de distribucin de probabilidad).
La forma concreta de la funcin de distribucin de probabilidad puede ser establecida a partir de
medidas experimentales o, postulada y posteriormente contrastada con los experimentos. Al postular
distintas distribuciones de probabilidad se tendr una determinada teora estadstica y la interpola-
cin de los resultados experimentales ser diferente. Generalmente consideraremos que la funcin de
distribucin que caracteriza nuestras medidas es una funcin de distribucin normal o Gaussiana1 .

2.1. Definicin de probabilidad


2.1.1. El espacio muestral
En teora estadstica al conjunto de todos los posibles resultados de una medida se le denomina
espacio muestral, S. Por ejemplo,
(i) En un experimento se miden el nmero de partculas emitidas por una fuente radiactiva. El
espacio muestral est formado por los nmeros 0, 1, 2, ... Puesto que la magnitud determinada en el
experimento es una magnitud aleatoria discreta, el espacio muestral es un conjunto contable.
(ii) En un experimento se determina el volumen necesario de cido que hay que utilizar para
alcanzar el punto de equivalencia en una valoracin cido-base. El volumen puede tomar cualquier
valor, tal que V > 0. La magnitud estudiada es una magnitud aleatoria continua y el espacio muestral
puede ser cualquier nmero real positivo (V > 0) y el espacio muestral es un conjunto no contable.
Cada posible subconjunto del espacio muestral se le denomina suceso, A. Un suceso que corres-
ponde al resultado de una medida constituye un suceso elemental o simple.

2.1.2. Definicin emprica de probabilidad


Intuitivamente identificamos la probabilidad de un suceso con la frecuencia con la que esperamos
que este ocurra. Podeamos definir la probabilidad de suceso A, P(A), como la frecuencia con que este
1
Estudiaremos esta funcin de distribucin de probabilidad en el tema 5 Distribuciones de probabilidad de variables
aleatorias continuas

16
2 2.Teora estadstica de los errores(I). Probabilidad

se produce en un experimento. De acuerdo con esta definicin

nA
P (A) = (2.1)
N

donde nA es el nmero de veces que se repite el suceso A, y N es el nmero total de experimentos.


Aunque esta definicin sea suficiente para satisfacer nuestra intuicin tiene serias limitaciones.
Entre otras:

P(A) depende del nmero total de medidas.

P(A) depende del experimento: al repetir el experimento el valor de P(A) puede variar.

Ejemplo 1. Limitaciones de la definicin emprica de probabilidad


Para demostrar las limitaciones de la definicin emprica de probabilidad examinaremos un ex-
perimento consistente en contar el nmero de caras que aparecen al lanzar cuatro monedas al
aire.
Para estimar la frecuencia esperada para cada suseso calcularemos el nmero de veces que espe-
ramos observar un evento,nA , (contar dos caras) frente al nmero total posibles combinaciones
de caras y cruces.

Nmero de caras combinaciones nA P (A)

1
0 XXXX 1 16
4
1 CXXX, XCXX 4 16
XXCX, XXXC
6
2 CCXX, CXCX, CXXC 6 16
XCCX, XCXX, XXCC
4
3 CCCX, CXCC, 4 16
CXCC, XCCC
1
4 CCCC 1 16

Utilizando un programa de ordenador se simul el experimento de lanzar cuatro monedas al


aire un gran nmero de veces. Para calcular el nmero de caras que se espera observar en cada
experimento se calculo este como N P (A).

17
2.1 2.1. Definicin de probabilidad

Nmero de caras 0 1 2 3 4
16 lanzamientos
Esperado 1 4 6 4 1
Experimento 1 2 7 2 4 1
Experimento 2 3 4 4 5 0
160 lanzamientos
Esperado 10 40 60 40 10
Experimento 3 9 40 61 38 12
1600 lanzamientos
Esperado 100 400 600 400 100
Experimento 3 125 403 567 409 96
16000 lanzamientos
Esperado 1000 4000 6000 4000 1000
Experimento 3 1009 3946 5992 4047 1006

En el ejemplo anterior se observa que el acuerdo entre la prediccin terica (nmero de obser-
vaciones esperadas) y el resultado experimental mejora con el nmero de ensayos. Esto indica que
conforme el nmero de experimentos aumenta la frecuencia muestral o experimental se aproxima a
la frecuencia terica. Este observacin ilustra la ley de los grandes nmeros: para valores suficiente-
mente grandes del nmero de medidas, N, las frecuencias muestrales se aproximan a la probabilidad
conforme aumenta de N.

2.1.3. Definicin aximtica de probabilidad


Supongamos que tenemos un espacio muestral S. Para cada suceso A de este espacio muestral,
asociamos un nmero real P(A). Entonces P es una funcin real que se denomina funcin de proba-
bilidad y P(A) la probabilidad del suceso A, si se cumplen los axiomas siguientes:

Axioma 1. Para cada suceso A, P (A) 0.

Axioma 2. Para el suceso cierto o seguro: P (S) = 1.

Axioma 3. Para dos sucesos cualesquiera, A y B, la probabilidad del suceso que se obtenga A o se
obtenga B, P (A B), viene dada por

P (A B) = P (A) + P (B) P (A B) (2.2)

que se simplifica cuando los sucesos son mutuamente excluyentes ( P (A B) = 0)

P (A B) = P (A) + P (B) (2.3)

como se ilustra en el diagramas de Venn de la figura 2.1.


Esta propiedad puede generalizarse a cualquier nmero de sucesos.

18
2 2.Teora estadstica de los errores(I). Probabilidad

Figura 2.1: Diagrama de Venn que ilustra el significado de P (A B).

Algunas consecuencias de estos axiomas son:


Para cada suceso P(A):
0 P (A) 1 (2.4)

es decir la probabilidad de un suceso est entre cero y uno.


El suceso imposible tiene probabilidad nula, P () = 0.
Si A es el suceso complemento de A entonces:

P (A0 ) = 1 P (A) (2.5)

2.1.4. Probabilidad condicional


La probabilidad de que dos sucesos A y B ocurran simultneamente, P (A B), viene dada por

P (A B) = P (A)P (B|A) = P (B)P (A|B) (2.6)

donde P (B|A) es la probabilidad condicional de que suceda B si ha ocurrido A.


Si A y B son sucesos independientes, P (B|A) = P (B),

P (A B) = P (A) P (B) (2.7)

19
2.2 2.2. Funciones de distribucin de probabilidad.

Ejemplo 2. Calculos con probabilidades condicionales


Suponga que dispone de una bolsa con tres bolas rojas y cuatro bolas azules. Calcule la proba-
bilidad de extraer una bola roja y despus una azul, si (a) no reemplaza la bola extrada, y (b) se
reemplaza la bola extrada.
(a)
3 4
P (R1 A2 ) = P (R) P (A|R) = = 0,29
7 6
bolas rojas 3
P (R) = =
bolas 7
bolas azules 4
P (A|R) = =
bolas 6
(b)
3 4
P (R1 A2 ) = P (R) P (A|R) = = P (R) P (A) = = 0,24
7 7
bolas rojas 3
P (R) = =
bolas 7
bolas azules 4
P (A|R) = =
bolas 7

2.2. Funciones de distribucin de probabilidad.

Debido a los errores aleatorios los resultados de medidas realizadas en idnticas condiciones pro-
ducen valores distintos. Esto supone que las medidas experimentales son magnitudes aleatorias.
De acuerdo con los posibles resultados de la medida podemos tener:
Magnitudes discretas: pueden tomar valores discretos y corresponden a variables aleatorias
discretas.
Magnitudes continuas pueden tomar cualquiera de los valores de un intervalo finito o infinito
y corresponden a variables aleatorias continuas..
En la primera categora entra un experimento de conteo de fotones. En este se mide el nmero
de fotones que cuenta un fotomultiplicador en la unidad de tiempo. Este slo puede ser un nmero
natural: 0,1,2,..., 200, . . . , puesto que no podemos contar fracciones de fotn. A la segunda categora
pertenecen las medidas de conductividad de una disolucin de electrolitos que pueden tomar cualquier
valor dentro de un intervalo: el resultado de la medida es un nmero real.
En adelante para hacer referencia a la magnitud aleatoria utilizaremos letras maysculas, mientras
que para los resultados de un experimento utilizaremos letras minsculas.

20
2 2.Teora estadstica de los errores(I). Probabilidad

2.2.1. Distribuciones de probabilidad de variables aleatorias discretas.


Sea X una variable aleatoria discreta. Supongamos que los valores que puede tomar estan dados
por x1 , x2 , x3 , . . . ordenados en orden creciente de valor.
La probabilidad de obtener el valor xi , P (xi ), viene dada por

P (xi ) = f (xi ) (2.8)

donde f (xi ) es la funcin de probabilidad o funcin de frecuencia de X.


De acuerdo con la definicin axiomtica de probabilidad, f (xi ) cumple:

f (xi ) 0 (2.9)

N
X
f (xi ) = 1 (2.10)
i=1

donde N es el nmero total de posibles valores que puede tomar xi .


Se define como funcin de distribucin probabilidad acumulada o funcin de distribucin de X,
F (xk ) a la probabilidad de que la variable aleatoria tome un valor x tal que x xk ,

F (xk ) = P (X xk ) (2.11)

donde xk es cualquier nmero real en el intervalo - < x < +.


Es importante que tenga en cuenta que cuando trabajamos con magnitudes aleatorias discretas:

f (xi ), funcin de probabilidad o funcin de frecuencia de X. Probabilidad de que la variable


aleatoria X tome el valor xi

F (xi ): funcin de distribucin probabilidad acumulada. Probabilidad de que la variable alea-


toria X tome cualquier valor, xj que cumpla xj xi

Cmo se calcula F (xk )?


F(xk ) se puede calcular a partir de f(x) como
X
F (xk ) = f (xi ) (2.12)
xi xk

F (xk ) es una funcin montona creciente.

21
2.2 2.2. Funciones de distribucin de probabilidad.

Si X toma nicamente un nmero finito de valores x1 , x2 , x3 , . . . xk entonces la funcin de distri-


bucin acumulada viene dada por:


0 < xk < x1
f (x ) < xk < x2

1



f (x1 ) + f (x2 ) < xk < x3



F (xk ) = ... ... (2.13)
f (x ) + f (x ) + + f (x ) < x < x

1 2 n k n+1



. . . . . .




1 xk < +

Ejemplo 3. Clculo de la funcin de distribucin de probabilidad acumulada, F (xk ), de


una variable aleatoria discreta
Considere la variable aleatoria X="nmero de caras que se obtiene al lanzar cuatro monedas al
aire".
Determinar las funciones de probabilidad y de distribucin de X.

x 0 1 2 3 4
1 4 6 4 1
f (x) 16 16 16 16 16

F (xk ) puede obtenerse a partir de f (x) utilizando la ecuacin 2.12


X
F (xk ) = f (xi )
xi xk

x<0 x<1 x<2 x<3 x<4 x0


1 5 11 15
F (x) 0 16 16 16 16
1

22
2 2.Teora estadstica de los errores(I). Probabilidad

Figura 2.2: Funciones de probabilidad, f (xi ) y de distribucin de probabilidad acumulada, F (xk )


para el ejemplo 3.

23
2.2 2.2. Funciones de distribucin de probabilidad.

2.2.2. Distribuciones de probabilidad de variables aleatorias continuas


Sea una variable continua X. La funcin de distribucin de probabilidad o funcin de densidad
de probabilidad , f (x), proporciona la probabilidad de que la magnitud aleatoria se encuente en el
intervalo [x, x + dx]

P (x X x + dx) = f (x) (2.14)

De acuerdo con la definicin axiomtica de probabilidad, f (x) cumple:

f (x) 0 (2.15)

Z +
f (x)dx = 1 (2.16)

La probabilidad de que X se encuentre en el intervalor [a, b] viene dada por


Z b
P (a X b) = f (x)dx (2.17)
a

Es importante tener en cuenta que para una variable aleatoria continua, P (X = xi ) = 0,

P (a X b) = P (a X < b) = P (a < X b) = P (a < X < b) (2.18)

Figura 2.3: Funciones de densidad de probabilidad, f (x) de una variable aleatoria continua. Signifi-
Rb
cado de P (a x b) = a f (x)dx.

24
2 2.Teora estadstica de los errores(I). Probabilidad

Por analoga con las funciones de distribucin de probabilidad discretas se puede definir la funcin
de distribucin de probabilidad integrada de una variable aleatoria continua, F (xi ), continua como:
Z xi
F (xi ) = P (X xi ) = P ( X xi ) = f (u)du (2.19)

A partir de esta definicin se pueden obtener las siguientes relaciones:

Z b Z b Z a
P (a X b) = f (x)dx = f (x)dx f (x)dx = F (b) F (a) (2.20)
a

P (X > a) = 1 P (X a) = 1 F (a) (2.21)

ya que x>a es el suceso complementario a x a.


Algunas propiedades de F(x) son:

En todo el intervalo en que f(x) es continua,

dF (x)
f (x) =
dx

Si x2 >x1 tendremos que F(x2 ) >F(x1 ). Es decir F(x) es montona creciente.

F () = 0 y F (+) = 1

Figura 2.4: Funciones de distibucin de probabilidad, F (x). Significado de P (a x b) = F (b)


F (a)

25
2.2 2.2. Funciones de distribucin de probabilidad.

Ejemplo 4. Clculo de la constante de normalizacin de una funcin de distribucin de


probabilidad, f (x), de una variable aleatoria continua
Hallar la constante c para que la funcin de densidad de probabilidad

0 x<0
f (x) = cx2 0 x 3
0 x>3

sea una funcin de distribucin de probabilidad y calcular P(1<x<2).


Para que f(x) sea una funcin de distribucin de probabilidad debe cumplir la condicin (ver
ecuacin 2.16)
Z +
f (x)dx = 1

Sustituyendo en la ecuacin 2.16


Z + Z 3
3
21 3
f (x)dx = c x dx = cx = 9 c = 1
0 3 0

se obtiene que c = 1/9.


Utilizando la ecuacin 2.17
Z b
P (a X b) = f (x)dx
a
se obtiene
Z 2
2
1 2 1 3 7
P (1 X 2) = x dx = x =
1 9 27 1 27

Ejemplo 5. Clculo de la funcin de distribucin de probabilidad integrada, F (x), de una


variable aleatoria continua
Sea x una variable aleatoria con funcin de densidad de probabilidad normalizada


0 x<0
1x 0x1

f (x) =

x1 1x2
0 x>2

(a) Determine F(x), (b) calcule P (0 X 1) y (c) P (x = 0, 1/2, 1, 3/2, 2).

26
2 2.Teora estadstica de los errores(I). Probabilidad

(a) Para calcular F(x) utilizaremos la ecuacin 2.19


Z x
F (x) = f (u)du

Para x < 0, F (x) = 0.


En el intervalo 0 x 1,
Z x Z x
x
1 2 1
F (x) = f (u)du = (1 u) du = t t = x x2
2 0 2
En el intervalo 1 x 2,

Z x Z 1 Z 2
F (x) = f (u)du = (1 u) du + (u 1) du
1
1 x
1 2 1 2 1
= t t + t t = x2 x + 1
2 0 2 1 2

En el intervalo x > 2,F (x) = 1, ya que la funcin de densidad de probabilidad est normalizada.


0 x<0
1 2
x 2x 0x1

F (x) = 1 2
x x+1 1x2
2


1 x>2
(b) Teniendo en cuenta que - ecuacin 2.20

P (a X b) = F (b) F (a)

P (0 X 1) = F (1) F (0) = 0,5


(c) P (x = 0, 1/2, 1, 3/2, 2) = P (0) + P (1/2) + P (3/2) + P (2) = 0, por ser la variable x una
variable continua.

27
2.2 2.2. Funciones de distribucin de probabilidad.

Ejemplo 6. Clculo f (x) a partir de F (x)


Sea x una variable aleatoria con funcin de distribucin de probabilidad


0 x<0
1 2
x 0x1

F (x) = 2
1 2

2x 2 x 1 1 x 2
1 x>2

Hallar f(x)


0 x<0
dF (x) x 0x1
f (x) =
dx
2x 1x2
0 x>2

Concepto de cuantila
Finalmente, se define como la cuantila, x , el valor de la variable aleatoria X para el que se
cumple

F (x ) = P (x x ) = (2.22)
Habitualmente se utilizan las 100 percentila. Por ejemplo, la cuantila 0.1 (o la percentila 10)
corresponde al valor de la variable aleatoria, x0,1 , tal que F (x0,1 ) = 0,1.

28
2 2.Teora estadstica de los errores(I). Probabilidad

2.3. Ejercicios y problemas


Funciones de distribucin de probabilidad
Cuestin 2.1 Elija la mejor respuesta.
Considere una variable alatoria continua X. La funcin de distribucin o densidad de probabilidad,f (x),
proporciona:
(a) f (x) = P (X = x)
(b) f (x) = P (x < X < x + dx)
(c) f (x) = P (x X < x + dx)
(d) f (x) = P (x < X x + dx)
(e) f (x) = P (x X x + dx)
(e) f (x) = P (x X)
(f) Las respuestas b,c,d,e son correctas, ya que son equivalentes
(g) Ninguna de las anteriores. La respuesta correcta es .........

Cuestin 2.2 Verdadero o falso. Jusitfique la respuesta.


Para una variable alatoria continua X, P (X = xi ) = 0

Cuestin 2.3 Indique las respuesta o respuestas correctas.


Considere una variable alatoria continua X con funcin de densidad de probabilidad f (x), P(X<a)
viene dado por
Ra Ra R
(a)
f (x)dx (b) 1
f (x)dx (c) a
f (x)dx
R
(d) 1 a
f (x)dx (e) F (a) (e) 1 F (a)

(f) Ninguna de las anteriores.

Ejercicio 2.1 Dada la funcin de densidad de probabilidad



0 x<0
1 2
f (x) = x 0x3
9
0 x>3
(a) Encuentre la funcin de distribucin, F(x), correspondiente. (b) Utilice este resultatado para
calcular P (1 x 2).

Ejercicio 2.2 La funcin de distribucin de la variable aleatoria X es



0 x<0
F (x) =
1 e2x x 0
(a) Encuentre la funcin de densidad, f(x), correspondiente. (b) Utilice las funciones de distribucin
y densidad para calcular la probabilidad de que X>2. (c) Utilice las funciones de distribucin y
densidad para calcular la probabilidad de que 3 X 4.

29
2.3 2.3. Ejercicios y problemas

Ejercicio 2.3 Una variable aleatoria X tiene una funcin de densidad


c
f (x) =
x2 + 1
donde < x <
(a) Encuentre el valor de la constante c. (b) Encuentre la probabilidad de que X2 se encuentre
entre 1/3 y 1.

Ejercicio 2.4 Dada la funcin de distribucin de probabilidad



0 x<a
f (x) = k axb
0 x>b

Determine el valor de k. Qu valor tendrn esta magnitud si a = -e y b = e?.

2.3.1. Soluciones a los ejercicios


Funciones de distribucin de probabilidad
Ejercicio 2.1 (a)
0 x<0
x3
F (x) = 27
0x3
1 x>3

7
(b) 27

Ejercicio 2.2 (a)



0 x<0
f (x) =
2e2x x 0
(b) e4 . (c) 1 e8

Ejercicio 2.3 (a) De acuerdo con la ecuacin 2.16


Z +
f (x)dx = 1

Z +
c 1
h  i
dx = c tan x = c = 1
x2 + 1 2 2
c = 1/
(b) Si 13 X 2 1, los valores de X pueden estar en los intervalos 33 X 1 y 3
3
X
1.
Por lo tanto la probabilidad requerida es

30
2 2.Teora estadstica de los errores(I). Probabilidad


3 3 3
Z Z Z
1 3 dx 1 3 dx 2 3 dx
=
1 x2 + 1 1 x2 + 1 x2 + 1
"1 #
2 3
= tan1 (1) tan1 ( )
3
2 h i 1
= =
4 6 6

2.4. Lecturas recomendadas


Para completar la preparacin de este tema recomendamos la lectura de:

Captulo 1. Magnitudes aleatorias y sus caractersitcas. del texto de Spiridonov y Lopatkin[7].


X
Repasa los conceptos bsicos de probabilidad y funcin de distribucin de propabilidad. Ade-
cuado para revisar la teora del tema.

Captulo 2. Variables aleatorias y distribucin de probabilidad del libro de Spiegel y cols.[5].


En el captulo recomendado los autores tratan temas no estudiados en esta asignatura como las
distribuciones de probabilidad conjunta, ... Se recomienda revisar las secciones cuyos conteni-
dos coinciden con los del curso: Variables aleatorias. Distribuciones de probabilidad discreta.
Funciones de distribucin para variables aleatorias. Funciones de distribucin para variables
aleatorias discretas. Funciones de distribucin para variables aleatorias continuas. Interpreta-
ciones grficas.
Tambin se recomienda la realizacin de los ejercicios suplementarios 2.47 a 2.53.X

Tema 2. Variables aleatorias y distribuciones de probabilidad. del texto de Walpole y Myers[6].


Se recomienda la consulta de las secciones: 1.Concepto de variable aleatoria; 2. Distribucin
discreta de probabilidad; 3. Distribucin continua de probabilidad; y 4. Distribuciones empri-
cas.

31
3

Teora estadstica de los errores(II). Esperanza matemtica

Contenidos Esperanza matemtica de una magnitud aleatoria Definicin de es-


peranza matemtica. Propiedades de la esperanza matemtica Momentos
de una distribucin. Media y varianza.
Propiedades generales y propiedades muestrales de una magnitud
aleatoria Media general de una magnitud aleatoria, . Media muestral
de una magnitud aleatoria, x. Varianza de una magnitud aleatoria, 2 (x).
Dispersion o varinza muestral de una magnitud aleatoria, s2 (x).

Objetivos Comprender el concepto de esperanza matemtica


Calcular la esperanza matemtica , E {y(x)}, de una funcin y(x) de una
variable aleatoria discreta conocida f(x)
Calcular la esperanza matemtica , E {y(x)}, de una funcin y(x) de una
variable aleatoria continua conocida f(x)
Conocer y utilizar las propiedades de la esperanza matemtica
Calcular los momentos de orden k respecto del parmetro c, Mk de una
variable aleatoria discreta o continua
Distinguir entre magnitudes generales y mmuestrales
Comprender la diferencia entre mux y x
Comprender la diferencia entre 2 (x) y s2 (x)
Evaluar mux y 2 (x) de una magnitud aleatoria
Calcularla media y la varianza muestral de un conjunto de medidas

33
3.1 3.1. Esperanza matemtica de una magnitud aleatoria

3.1. Esperanza matemtica de una magnitud aleatoria


3.1.1. Magnitudes aleatorias discretas
Sea una magnitud aleatoria discreta, x, y una funcin y(x). Si f (x) es la funcin de distribucin
de probabilidad de la variable x, se define como esperanza matemtica de la funcin y(x),
k
X
E {y(x)} = y(xi ) f (xi ) (3.1)
i=1

donde la suma se extiende a todos los posibles valores de x.

3.1.2. Magnitudes aleatorias continuas


Sea una magnitud aleatoria continua, x, y una funcin y(x). Si f (x) es la funcin de densidad de
probabilidad de la variable x, se define como esperanza matemtica de la funcin y(x),
Z
E {y(x)} = y(x) f (x) dx (3.2)

donde la suma se extiende a todos los posibles valores de x.

3.1.3. Propiedades de la esperanza matemtica


Algunas propiedades de la esperanza matemtica son:

Si c es una constante (magnitud no aleatoria) tendremos que

E {c} = c (3.3)

E {c y(x)} = c E {y(x)} (3.4)

Si la magnitud aleatoria x es la suma de n magnitudes aleatorias independientes

x = x1 + x2 + . . . + xn (3.5)

su esperanza matemtica es la suma de la esperanza matemtica las n magnitudes sumadas

E {x} = E {x1 } + E {x2 } + . . . + E {xn } (3.6)

34
3 3.Teora estadstica de los errores(II). Esperanza matemtica

Si la magnitud aleatoria y es una funcin no lineal de n magnitudes aleatorias independientes

y = f (x1 , x2 , . . . , xn ) (3.7)

que varia poco en intervalos pequeos de variacin de los argumentos, el valor de E {y} es
aproximadamente

E {y} = f (E {x1 } , E {x2 } , . . . E {xn }) (3.8)

3.1.4. Momentos de una distribucin.


Dada una variable aleatoria, x, discreta o continua, se llama momento de orden k respecto del
parmetro c, Mk a las esperanza matemtica de la variable (x c)k

Mk = E (x c)k

(3.9)

Si c = 0 tenemos los momentos respecto del origen a los que suele representarse por k

k = E (x)k

(3.10)

Dos momentos de importantes son 0 = 1 y 1 = X (valor medio de x o media de x).

0 = E (x)0 = E {1} = 1

(3.11)

1 = E (x)1 = E {x} = x

(3.12)

Si c = X hablamos de momentos centrales o momentos respecto de la media. Suele represetarse


por k y vienen dados por

k = E (x x )k

(3.13)

Momentos de importantes son 0 = 1, 1 = 0 y 2 = x2 (varianza de x).

2 = E (x x )2 = x2

(3.14)

35
3.1 3.1. Esperanza matemtica de una magnitud aleatoria

Ejemplo 1. Clculo de la media y la varianza de una variable aleatoria discreta


Considere la variable aleatoria X que tiene la siguiente funcin de distribucin de probabilidad

x 8 12 16 20 24
1 1 3 1 1
f (x) 8 6 8 4 12

Clcule la media y la varianza de X.


La media viene dada por la ecuacin 3.12

x = E {x}
Sustituyendo
X 1 1 3 1 1
x = x f (x) = 8 + 12 + 16 + 20 + 24 = 16
8 6 8 4 12
La varianza viene dada por la ecuacin 3.14

x2 = E (x x )2


X
x2 = E (x x )2 = (x 16)2 f (x)


1 1 3 1 1
= (8 16)2 + (16 12)2 + (16 16)2 + (20 16)2 + (24 16)2
8 6 8 4 12
1 1 3 1 1
= 64 + 16 + 0 + 16 + 64
8 6 8 4 12
= 20

La varianza tambin viene dada por

x2 = E (x2 ) 2x


X 1 1 3 1 1
E x2 = x2 f (x) = 64 + 144 + 256 + 400 + 24

= 276
8 6 8 4 12

x2 = E (x x )2 = 276 (16)2 = 276 256 = 20




Como muestran los resultados los dos mtodos utilizados para calcular la varianza son equiva-
lentes.

36
3 3.Teora estadstica de los errores(II). Esperanza matemtica

Ejemplo 2. Clculo de la media y la varianza de una variable aleatoria continua


Sea la variable aleatoria X que tiene por funcin de densidad

0 < a < x
dF (x)
f (x) = k a<x<b
dx
0 x<b
Calcular la media y la varianza de X.
Antes de poder calcular la media y la varianza tenemos que determinar el valor de k.
Para que f(x) sea una funcin de densidad de probabilidad debe cumplir (ver ecuacin 2.16)
Z +
f (x)dx = 1

Es decir,
Z b
kdx = k (b a) = 1
a

por tanto k = 1/(b a)


La media viene dada por (ecuacin 3.12)
Z +
x = E {x} = x f (x) dx

Z b
x b+a
x = dx =
a ba 2
La varianza viene dada por la ecuacin 3.14

x2 = E (x x )2


que es equivalente a

x2 = E x2 2x


+ b
b
x2 1 x3 1 b 3 a3
Z Z
E x2 = 2

x f (x) dx = dx = =
a ba 3 b a a 3 ba
1
x2 = (b a)2
12

37
3.2 3.2. Propiedades generales y propiedades muestrales de una magnitud aleatoria

3.2. Propiedades generales y propiedades muestrales de una mag-


nitud aleatoria
De acuerdo con los postulados de la teora estadstica de los errores tras un nmero suficiente-
mente grande de experimentos, lo valores obtenidos para la magnitud medida tienden a agruparse
alrededor de un valor, y su dispersin alrededor de este valor est caracterizada por una funcin de
distribucin de probabilidad. En general, una vez conocida la forma de la distribucin de probabili-
dad, basta para caracterizarla un nmero limitado de constantes. Estos parmetros que caracterizan
al conjunto de todas las medidas que puedan obtenerse de un experimento en ciertas condiciones se
denominan parmetros poblacionales.
El conjunto de medidas obtenidas en una serie experimentos se denomina muestra. Como el n-
mero de medidas que componen la muestra normalmente es pequeo, los parmetros que caracterizan
la muestra, propiedades o parmetros muestrales. En general los parmetros muestrales no coinciden
con los parmetros poblacionales. Sin embargo, podemos obtener valores aproximados de losparme-
tros poblacionales a partir de los parmetros muestrales (estimas) 1 .
Una propiedad de las estimas es que son variables aleatorias mientras que los parmetros po-
blacionales son valores constantes y caractersticos de la funcin de distribucin de probabilidad
asociada a los errores aleatorios.
Finalmente, una cuestin de notacin. En esta seccin designaremos las propiedades poblaciona-
les utilizando el alfabeto griego, mientras que utilizaremos el alfabeto latino para propiedades mues-
trales.

Propiedades generales de las estimas


Si T es una estima del parmetro poblacional , T debe cumplir entre otros criterios que

E {T } = T = . Esto equivale a decir que la estima T no es una estima sesgada.

La estima es consistente. Es decir, cuanto mayor es el nmero de medidas utilizadas para cal-
cular T , mayor es la proximidad entre los valores de T y

Propiedades muestrales de uso frecuente


Para describir nuestras medidas haremos referencia a dos tipos de propiedades muestrales:

un nmero alrededor del que las medidas se agrupan: media muestral, x.

un nmero que da una medida de la dispersin de los valores alrededor de la media: la desvia-
cin tpica muestral, s(x).

Utilizaremos la media muestral, x como estima del valor real. Como medida de la incertidumbre
de cada medida utilizaremos la desviacin tpica de nuestros datos, s(x), mientras que para acotar la
incertidumbre de la estima de la media utilizaremos la desviacin tpica muestral de la media, s(
x).
1
Existen distintos mtodos para obtener estimas. Algunos de ellos son el mtodo de mxima verosimilitud, el mtodo
de mnimos cuadrados, el mtodo de los momentos y el mtodo Bayesiano. La descripcin de estos mtodos excede los
objetivos del curso

38
3 3.Teora estadstica de los errores(II). Esperanza matemtica

3.2.1. Media general de una magnitud aleatoria


El valor medio de la magnitud aleatoria x para el conjunto general es la esperanza matemtica de
la magnitud aleatoria

x = E {x} (3.15)

3.2.2. Media muestral de una magnitud aleatoria


La media muestral de la magnitud aleatoria x se define como el valor medio de los valores obser-
vados x1 ,x2 , . . . ,xn,
n
x1 + x2 + . . . + xn 1 X
x = = xj (3.16)
n n j=1

3.2.3. Varianza de una magnitud aleatoria.


La varianza o dispersin de una magnitud aleatoria x se define como la esperanza matemtica de
las desviaciones respecto a la media general:

x2 = E (x x )2

(3.17)

Al valor positivo de la raz cuadrada de la varianza, (x), se le llama desviacin cuadrtica media,
desviacin tpica o desviacin normal.
Algunas propiedades de la varianza son:

Si c es una constante (magnitud no aleatoria) tendremos que:

2 (c) = 0 (3.18)

2 (c x) = c2 2 (x) (3.19)

Si la magnitud aleatoria x es la suma de n magnitudes aleatorias independientes

x = x1 + x2 + . . . + xn (3.20)

la varianza de x es la suma de las varianzas de las n magnitudes sumadas

2 (x) = 2 (x1 ) + 2 (x2 ) + . . . + 2 (xn ) (3.21)

39
3.2 3.2. Propiedades generales y propiedades muestrales de una magnitud aleatoria

Sin embargo,(x) viene dado por

p
(x) = 2 (x1 ) + 2 (x2 ) + . . . + 2 (xn ) (3.22)

La varianza se puede calcular a partir de los momentos respecto del origen 1 y 2 :

2 (x) = E x2 2x

(3.23)

Si la magnitud aleatoria y es una funcin no lineal de n magnitudes aleatorias independientes

y = f (x1 , x2 , . . . , xn ) (3.24)

que varia poco en intervalos pequeos de variacin de los argumentos, el valor de 2 (y) es
aproximadamente

 2  2  2
2 f 2 f 2 f
(y) = (x1 ) + (x2 ) + . . . 2 (xn ) (3.25)
x1 x2 xn
Esta propiedad es til para el clculo de la incertidumbre de magnitudes complejas.

Ejemplo 3. Varianza de una magnitud indirecta


Utilizando un puente de Wheatstone, la resistencia de una disolucin de electrolitos, W , puede
calcularse mediante la ecuacin
 
1000 a 1000
W = R = R 1
a a
donde R es el valor de una resistencia patrn conocida y a es la lectura de la resistencia que se
obtiene experimentalmente cuando se equilibra el puente de Wheatstone.
Calcule la incertidumbre de W . Considere que la incertidumbre de R es despreciable.
De acuerdo con la ecuacin 3.30
 2  2  2
2 f 2 f 2 f
(y) = (x1 ) + (x2 ) + . . . 2 (xn )
x1 x2 xn
que en nuestro caso se reduce a
 2
2 W
(W ) = 2 (a)
a

40
3 3.Teora estadstica de los errores(II). Esperanza matemtica

 
W 1000
= R
a a2
106 2
2 (W ) = R2 (a)
a4

Ejemplo 4. Varianza de una magnitud indirecta (II)


Determine la incertidumbre en la medida de la entalpia para la reaccin

NH3 (g) + 54 O2 (g)  O(g) + 32 H2 O(g) Hr R.1

Considere las reacciones:

H2 O(g)  H2 O(l) H2 R.2

1
N (g)
2 2
+ 32 H2 (g)  NH3 (g) H3 R.3

1
H (g)
2 2
+ 12 O2 (g)  H2 O(g) H4 R.4

1
2
NO(g)  12 N2 (g) + 12 O2 (g) H5 R.5

Utilizando la ley de Hess podemos expresar Hr en funcin de las entalpias de las reacciones
R.2 a R.5
3 3
Hr = H2 H3 + H4 H5
2 2
y de acuerdo con las propiedades de la dispersin muestral, ecuacin 3.30, la incertidumbre en
Hr es
3 3
2 (Hr ) = ( )2 2 (H2 ) + 2 (H3 ) + ( )2 2 (H4 ) + 2 (H5 )
2 2

41
3.2 3.2. Propiedades generales y propiedades muestrales de una magnitud aleatoria

3.2.4. Dispersion o varinza muestral de una magnitud aleatoria


La dispersin muestral de una magnitud aleatoria prodra definirse como

n
1X
s2 = (xj x )2 (3.26)
n j=1

Esta expresin presupone que conocemos el valor de x . Como slo disponemos de una estima de
x. Si sustituimos la media muestral por la media poblacional con lo
esta magnitud, la media muestral,
que tendriamos:

n
2 1X
s = (xj x)2 (3.27)
n j=1

Sin embargo cuando comprobamos la propiedades de esta estma observamos que la estima de (x)2
que obtenemos, s2 es una estima sesgada: E{s2 } < 2 (x).
Podemos obtener una buena estima sustituiyendo N en el cociente en la expresin de s2 por el
nmero de grados de libertad. El nmero grados de libertad es el nmero de observaciones indepen-
dientes, es decir aquellas en exceso a las necesarias para determinar los parametros que aparecen en
la ecuacin. En este caso, el nmero de grados de libertad es N-1 pues al menos necesitamos 1 dato
para determinar la media muestral.

n
2 1 X
s (x) = (xj x)2 (3.28)
n 1 j=1

En este caso E{s2 (x)} = 2 (x). s2 (x) es la varianza muestral de x.


Como en el caso de la varianza, si la magnitud aleatoria y es una funcin no lineal de n magnitudes
aleatorias independientes

y = f (x1 , x2 , . . . , xn ) (3.29)

que varia poco en intervalos pequeos de variacin de los argumentos, el valor de s2 (y) es aproxima-
damente

 2  2  2
2 f 2 f 2 f
s (y) s (x1 ) + s (x2 ) + . . . s2 (xn ) (3.30)
x1 x2 xn

Esta propiedad es til para el clculo de la incertidumbre de magnitudes complejas o indirectas2 .

2
Clculos de propagacin de errores

42
3 3.Teora estadstica de los errores(II). Esperanza matemtica

Ejemplo 5. Calculo de la media y la varianza muestral


En una serie de experimentos para determinar la entalpia neutralizacin del HCl y NaOH a
300 K se obtuvieron los siguientes valores:

H(kcal/mol) : 54,4, 56,4, 57,5, 56,6, 57,0, 56,5, 58,4, 57,0, 55,2
Determine el valor de media y la desviacin tpica de las medidas.
La media muestral viene dada por la ecuacin 3.16
n
x1 + x2 + . . . + xn 1 X
x = = xj
n n j=1

mientras que la varianza muestral se calcula utilizando la ecuacin 3.28


n
2 1 X
s (x) = (xj x)2
n 1 j=1

Medida xi xi x (xi x)2


1 54.4 -2.15 4.6225
2 56.4 -0.16 0.0256
3 57.5 0.94 0.8836
4 56.6 -0.04 0.0016
5 57.0 0.44 0.1936
6 56.5 -0.06 0.0036
7 58.4 1.84 3.3856
8 57.0 0.44 0.1936
9 55.2 -1.36 1.8496
SUMA 509.0 0.0 11.593

Sustituyendo en las ecuaciones 3.16 y 3.28 se obtiene x = 509,0/9 = 56,56 kcal.mol1 .


s2 = 11,1593/8 = 1,3949( kcal.mol1 )2 y s = 1,18 kcal.mol1 .
El resultado final H = 56,6 1,2 kcal.mol1 .

43
3.3 3.3. Mediana y moda

3.3. Mediana y moda


La media, o esperanza, de una variable aleatoria X proporcion una medida de la tendencia central
para los valores de una distribucin. Otras medidas de la tendencia central frecuentemente usadas son:

Moda Para una variable aleatoria discreta es el valor que ocurre con ms frecuencia o, en el que tiene
la mayor probabilidad de ocurrencia. Algunas veces tenemos dos, tres o ms len probabilidades
relativamente grandes de ocurrencia. En tales casos, decimos que la bimodal, trimodal o multi-
modal, respectivamente.
En el caso de una variable aleatoria continua X es el valor o valores de X donde la funcin de
densidad de probabilidad tiene un mximo relativo.

Mediana Valor de x para el cual P (X < x) = 12 y P (X > x) 12 . En el caso de una variable


continua tenemos P (X < x) = 12 = P (X > x), y la mediana separa la curva de densidad en
dospartes con reas iguales de 1/2 cada una. En el caso de una distribucin discreta, no existe
una mediana nica

44
3 3.Teora estadstica de los errores(II). Esperanza matemtica

3.4. Ejercicios y problemas


Cuestin 3.1 Demuestre

0 = 1

Cuestin 3.2 Demuestre

1 = 0

Cuestin 3.3 Demuestre

x2 = E x2 2x


Cuestin 3.4 Verdadero o falso. Jusitfique la respuesta.


La media muestral, x es una variable aleatora

Cuestin 3.5 Verdadero o falso. Jusitfique la respuesta.


La varianza, 2 (x) es una variable aleatora

Cuestin 3.6 Verdadero o falso. Jusitfique la respuesta.


La media x y la varianza 2 (x) son dos propiedas caractersticas de una variable aleatoria

Esperanza matemtica de una magnitud aleatoria


Ejercicio 3.1 Dada la funcin de densidad de probabilidad
Sea la variable aleatoria X que tiene por funcin de densidad

0
< x < 0
dF (x) x 0x<1
f (x) =
dx 2x 1x2
0 x>2

Calcular la media y la varianza de X.

Calculo de magnitudes muestrales


Ejercicio 3.2 Al realizar cinco medidas del indice de refraccin de una mecla se obtuvieron los
siguientes valores:

1.591, 1.521,1.528,1.570,1.587

45
3.4 3.4. Ejercicios y problemas

Ejercicio 3.3 Los resultados de una serie de medidas de la temperatura con un termometro agrupa-
dos en clases de anchura 0.1 K son

T/K 298 298.1 298.2 298.3 298.4 298.5


Fi 0.2 0.2 0.3 0.1 0.1 0.1

Dibuje el histograma asociado a estos datos.

Ejercicio 3.4 En una serie de experimentos se determino la capacidad de absorber metales pesados
presentes en el medio natural de ciertas especies de pescado. Los siguientes datos corresponden a
medidas de la concentracin promedio de cadmio (mg Cd por Kg de pez) para una especie en distintos
bancos del Atlntico.

13.1 8.4 16.9 2.7 9.6 4.5 12.5


5.5 12.7 17.1 10.8 18.9 27.0 18.0
6.4 13.1 8.5 7.5 12.1 8.0 11.4
5.1 5.6 5.5 5.0 10.1 4.5 7.9
7.9 8.9 3.7 9.5 14.1 7.7 5.7
6.5 10.8 14.7 14.4 5.1

Determine la media y la desviacin tpica de los datos. Dibuje el histograma correspondiente.

Ejercicio 3.5 Una medida de la eficiencia de una torre de destilacin es la velocidad de produccin
de vapor. En la tabla se recogen una serie de valores correspondientes a esta propiedad.

1170 1620 1495 1170 1710 1710 1530


1260 1440 1800 1170 1260 1170 1640
1800 1800 1530 1350 1800 1530 1170
1440 1530 1260 1350 1350 1350 1440
1170 1710 1620 1350 1730 1800 1800
1530 1440 1620

Determine la media y la desviacin tpica de los datos. Dibuje el histograma y diagrama de


frecuencias asociado a estos datos. Por debajo de que valor se encuentra el 90 % de los datos?.

3.4.1. Soluciones a los ejercicios


Esperanza matemtica de una magnitud aleatoria
Ejercicio 3.1 La media viene dada por (ecuacin 3.12)
Z +
x = E {x} = x f (x) dx

46
3 3.Teora estadstica de los errores(II). Esperanza matemtica

Z 1 Z 2
x = x x dx + x (2 x) dx
0 1
3 1 3 2

x x 1 2
= + x2 = + = 1
3 0
3 1 3 3

La varianza viene dada por la ecuacin 3.14

x2 = E (x x )2 = E x2 2x
 

Z 1 Z 2
E x2 = 2
x2 (2 x) dx

x x dx +
0 1
4 1 3
2
x4

x 2x 1 14 15 7
= + = + =
4 0 3 4 1 4 3 4 6

7 1
x2 = (1)2 =
6 6

3.5. Lecturas recomendadas


Para completar la preparacin de este tema recomendamos la lectura de:

Captulo 1. Magnitudes aleatorias y sus caractersitcas. del texto de Spiridonov y Lopatkin[7].


X
Revisa los contenidos del tema. Adecuado para revisar la teora del tema.

Captulo 3. Esperanza matemtica del libro de Spiegel y cols.[5].


En el captulo recomendado los autores tratan temas no estudiados en esta asignatura como las
funciones generatrices, ... Se recomienda revisar las secciones cuyos contenidos coinciden con
los del curso.
Se recomienda revisar los ejercicios resueltos 3.1, 3.2, 3.19(a).X

Tema 3.Esperanza matemtica. del texto de Walpole y Myers[6].


Se recomienda la consulta de las secciones: 1. Media de una variable aleatoria, 2. Varianza y
covarianza.

47
4

Distribuciones de probabilidad de variables aleatorias discretas

Contenidos Distribucin uniforme Descripcin y propiedades.


Distribucin binomial Descripcin y propiedades. Teorema de Moivre.
Distribucin de Poisson Descripcin y propiedades. La distribucin
de Poisson como lmite de la distribucin binomial. Convergencia de la
distribucin de Poisson a la distribucin de Gauss.

Objetivos Reconocer las caractersticas de la distribucin uniforme de una variable


aleatoria discreta
Reconocer las caractersticas de un experimento de Bernuilli
Realizar calculos de probabilidades de variables aleatorias que siguen un
distribucin binomial
Calcular y de variables que siguen un distribucin binomial
Utilizar el teorema de Moivre para calcular probabilidades de resultados de
un experimento de Bernuilli utilizando una distribucin normal
Realizar calculos de probabilidades de variables aleatorias que siguen un
distribucin de Poisson
Calcular y de variables que siguen un distribucin de Poisson
Utilizar la distribucin normal para calcular probabilidades de resultados
de un experimento de Poisson
Utilizar la distribucin de Poisson para calcular probabilidades de resul-
tados de un experimento de Bernuilli en el lmite de probabilidades de exito
bajas y nmero de pruebas grande

49
4.2 4.1. Distribucin uniforme

4.1. Distribucin uniforme


Qu variables aleatorias siguen esta funcin de probabilidad?. Esta distribucin de probabilidad
corresponde a variables aleatorias discretas que pueden tormar n valores, xi = x1 , x2 ,..., xn y todos sus
posibles valores tienen la misma probabilidad.
La funcin de distribucin de probabilidad es

1
f (x) = P (X = xi ) = donde i = 1, 2, . . . , n (4.1)
n

La media y la varianza de la distribucin vienen dadas por

n+1
= (4.2)
2

n2 1
2 = (4.3)
12

Ejemplo 1. Distribucin de probabiblidad uniforme


Considere la variable aleatoria X que corresponde a lanzar un dado y leer la cara superior del
dado. Si el dado no est trucado, todos los resultados tienen la misma probabilidad y la funcin
de distribucin de probabilidad de esta variable aleatoria es

x 1 2 3 4 5 6
1 1 1 1 1 1
f (x) 6 6 6 6 6 6

El diagrama de barras muestra la funcin de distribucin de probabilidad.

50
4 4. Distribuciones de probabilidad de variables aleatorias discretas

4.2. Distribucin binomial


Qu variables aleatorias siguen esta funcin de probabilidad?. Las variables que siguen la distri-
bucin binomial corresponden a los experimentos que cumplen
tenemos un nmero fijo n de experimentos (pruebas)
el resultado de cada experimento slo puede tener dos valores (exito y fracaso)
el resultado de un experimento es independiente de los anteriores y no influye en los posteriores
Estos experimentos tambin son conocidos como pruebas de Bernuilli.
Sea p (probabilidad de xito) la probabilidad de que un suceso ocurra en una sola prueba de
Bernuilli y q = 1 p (probabilidad de fracaso) ser la probabilidad de que ocurra el suceso opuesto
. La probabilidad de obtener x xitos en n ensayos (x xitos, n x fracasos) esta dada por la funcin
de probabilidad
 
n x nx n!
f (x) = P (X = x) = PB (X = x; n, p) = p q = px q nx (4.4)
x x!(n x)!

donde la variable aleatoria X denota el nmero de xitos en n pruebas. Esta funcin de probabilidad
discreta se denomina distribucin binomial o de Bernuilli. Una variable aleatoria con est distribu-
cin de probabilidad se dice que est distribuida binomialmente.
La media y la varianza de la distribucin vienen dadas por

= np (4.5)

2 = npq = np(1 p) (4.6)

Ejemplo 2. Clculo de probabiblidades de una variable binomial


Determine la probabilidad de obtener 2 caras en un seis lanzamientos de una moneda al aire.
Es este experimento una prueba de Bernuilli?

tenemos un nmero fijo de experimentos n = 6

el resultado de cada experimento slo puede tener dos valores (cara, p = 0,5 y cruz,
q = 0,5)

el resultado de cada experimento (lanzar una moneda al aire) es independiente de los


anteriores y no influye en los posteriores

Utilizando la ecuacin 4.4 calcularemos la probabildad del resultado


 
6 6!
PB (X = 2; 6, 0,5) = 0,52 0,562 = 0,52 0,54 = 15 0,25 0,0625 = 0,235
2 2!4!

51
4.2 4.2. Distribucin binomial

Ejemplo 3. Clculo de probabiblidades de una variable binomial (II)


Suponga que la probabilidad de que los resultados de un experimento sean aceptables es 0.6.
Si el experimento se repite 5 veces, obtenga la distribucin de resultados tiles y determine la
probabilidad de obtener al menos dos resultados tiles.
Estamos ante una prueba de Bernuilli?.

tenemos un nmero fijo de experimentos n = 5

el resultado de cada experimento slo puede tener dos valores (resultado aceptable, p =
0,6 y resultado no aceptable, q = 0,4). Tenga en cuenta que no nos estamos preguntando
por el valor de la propiedad que medimos, sino por la validez del experimento.

los resultado de cada experimento son independientes entre si

Para deteminar la funcin de distribucin utilizaremos la ecuacin 4.4 p = 0,6, q = 10,6 = 0,4
yn=5

5 5
 
PB (X = 0; 5, 0,6) = 0
0,60 0,45 = 0,01024 PB (X = 1; 5, 0,6) = 1
0,61 0,44 = 0,07680

5 5
 
PB (X = 2; 5, 0,6) = 2
0,62 0,43 = 0,23040 PB (X = 3; 5, 0,6) = 3
0,63 0,42 = 0,34560

5 5
 
PB (X = 4; 5, 0,6) = 4
0,64 0,41 = 0,2592 PB (X = 5; 5, 0,6) = 5
0,65 0,40 = 0,07776

De modo que la funcin de distribucin de probabilidad viene dada por

x 0 1 2 3 4 5
f (x) 0.01024 0.07680 0.23040 0.34560 0.2592 0.07776

El diagrama de barras muestra la funcin de distribucin de probabilidad.

52
4 4. Distribuciones de probabilidad de variables aleatorias discretas

La probabilidad de realizar ms de dos experimentos con resultados aceptables podemos calcu-


larla como

P (X > 2) = P (X = 3) + P (X = 4) + P (X = 5) = 0,6826
Tambin podemos tener en cuenta que el suceso complementario del calculado es obtener X 2
y utilizando la ecuacin 2.5 podemos calcular la probabilidad

P (X > 2) = 1 P (X 2) = 1 (P (X = 2) + P (X = 1) + P (X = 0)) = 0,68256

los dos tratamientos que son equivalentes como esperabamos

Ejemplo 4. Clculo de la varianza de una variable descrita por un distribucin binomial


Un fsico de partculas hace medidas de la distribucin angular de mesones K. Los resultados de
la medida pueden ser hacia delante o hacia atrs. Ambos procesos son igualmente probables.
En un experimento de calibrado se realizaron 1000 medidas y se obtuvieron 472 mesones en la
direccin hacia delante y 528 mesones en la direccin hacia atrs. Cul es la desviacin tpica
de los resultados?.
El experimento descrito cumple con las condiciones de un experimento de Bernouilli con una
probabilidad de xito p = 0,5.
Para calcular la desviacin tpica del experimento utilizaremos la ecuacin 4.6

2 = npq = np(1 p) (4.7)

p
= np(1 p) (4.8)
Sutituyendo,
p
= 1000 0,5 0,5 = 15,8 (4.9)

Ejemplo 5. Clculo de patrones de intensidad en un espectro de masas


Considere un halocarburo trisustituido RX3 . Si el sustituyente es Br, ste presenta dos istopos
de masas 79 y 81, con abundancias relativas 0.5069 y 0.4931.
Determine cuantos picos esperara observar en el espectro de masas del RBr3 y que intensidad
relativa esperara que tuvieran los picos del espectro.
En un espectro de masas se representa intensidad frente a masa de modo que la intensidad obte-
nida a una masa dada, M , es proporcional al nmero de molculas de masa M presentes en la
muestra.

53
4.2 4.2. Distribucin binomial

Si X1 Br79 y X2 Br81 , los isotopos de bromo pueden presentarse en la especie RBr3 en las
combinaciones

RX1 X1 X1 , RX1 X1 X2 , RX1 X2 X2 y RX2 X2 X2

Es decir, aparecern cuatro picos en el espectro de masas distintas.


La intensidad relativa de los picos depende de la frecuencia con la que se observe cada una de
las combinaciones. Como estamos trabajando con nmero de molculas muy grandes  101 9,
podemos suponer que la intensidad relativa con la que observamos cada pico, que depende de
la frecuencia con la que observamos cada una de los halocarburos, es igual a la probailidad de
observar un halocarburo de la masa indicada.
La probabilidad de obtener cada halocarburo viene dada por una distribucin binomial con n =
3, p = 0,5069 y q = 0,4931.

 
3
P (RBr379 ) = PB (X = 3; 3, 0,5069) = 0,50693 0,49310 = 0,1302
3
 
3
P (RBr279 Br81 ) = PB (X = 2; 3, 0,5069) = 0,50692 0,49311 = 0,3801
2
 
3
P (RBr79 Br281 ) = PB (X = 1; 3, 0,5069) = 0,50691 0,49312 = 0,3698
1
 
3
P (RBr381 ) = PB (X = 0; 3, 0,5069) = 0,50690 0,49313 = 0,1199
0

La distribucin de intesidades de los picos puede representrase con un diagrama de barras donde
M es la masa de la especie RBr79 79 81
3 , M + 2 es la masa de la especie RBr2 Br , M + 3 es la masa
de la especie RBr79 Br81 81
2 , y M + 3 la masa de la especie RBr3 .

54
4 4. Distribuciones de probabilidad de variables aleatorias discretas

4.2.1. Teorema de Moivre


Para tamaos de la muestra tales que los valores del producto npq >5 (tamaos de muestra gr-
nades), el comportamiento de la distribucin binomial se asemeja al de una distribucin normal con
media = np y varianza 2 = npq. Esta propiedad es conocida como teorema de Moivre.
Como la distribucin binomial es una distribucin de variables discretas, hay que hacer una correc-
cin de continuidad de modo que al utilizar la aproximacin de la distribucin binomial a una distri-
bucin gaussiana las probabilidades se calculan como

PB (X = a; n, p) =PG (a 0,5 X a + 0,5)


PB (a < X < b; n, p) =PG (a + 0,5 X b 0,5)
PB (a X b; n, p) =PG (a 0,5 X b + 0,5)

Este teorema permite calcular de una manera sencilla valores de la probabilidad de una distribu-
cin binomial en condiciones en las que es imposible evaluar esta magnitud utilizando la ecuacin
4.4
n!
PB (X = x; n, p) = px q nx (4.10)
x!(n x)!

4.3. Distribucin de Poisson


Esta distribucin describe el nmero de sucesos que ocurren en un intervalo de tiempo fijo o
en un volumen del espacio o por unidad de producto dado cuando los elementos estn distribuidos
aleatoriamente de acuerdo con una frecuencia de ocurrencia o densidad promedio. Es decir, el nmero
de xitos que observamos en cada unidad de tiempo, rea o producto es totalmente al azar (slo
conocemos su valor medio) y que cada intervalo de tiempo es independiente de otro intervalo dado,
as como cada rea es independiente de otra rea dada y cada producto es independiente de otro
producto dado.
Esta definicin es un tanto abstracta y se comprende mejor con algunos ejemplos de variables
que tienen este comportamiento: nmero de partculas emitidas por una fuente radiativa en un tiempo
definido, nmero de fotones emitidos por una molcula en su desexcitacin fluorescente desde un
estado excitado, nmero de errores cometidos por pgina al transcribir un texto,nmero de bacterias
por cm2 de cultivo, etc.
El espacio muestral de la variable X distribuida de acuerdo con una distribucin de Poisson son
los enteros {0,1,2, ...} y la funcin de distribucin viene dada por:
1 x
f (x) = P (X = x) = e x = 0, 1, 2, . . . (4.11)
x!

donde es una constante positiva.


La media y la varianza de esta distribucin vienen dadas por

= (4.12)

55
4.3 4.3. Distribucin de Poisson

2 = (4.13)

Ejemplo 6. Clculo de la varianza de una variable que sigue una distribucin de Poisson
Como parte de un experimento para determinar la vida media de dos istopos radiactivos de
plata, se registraron simultneamente el nmero de partculas emitidas en intervalos de dos se-
gundos en las cercanas de la plata. Los experimentos se repitieron 20 veces y se obtuvo un valor
medio de 1.69 partculas por segundo.
Cul es la desviacin tpica de las medidas?.
La distribucin de Poisson describe el nmero de sucesos que ocurren en un intervalo de tiempo
fijo cuando los elementos estn distribuidos aleatoriamente de acuerdo con una frecuencia de
ocurrencia.
De modo que = = 1,69 y 2 = = 1,69. La desviacin tpica viene dada por
p
= = 1,69 = 1,30 partculas por segundo

Ejemplo 7. Clculo de probabilidades de una variable que sigue una distribucin de Poisson

En un experimento de deteccin de neutrinos se observaron 8 neutrinos coincidentes con la


observacin ptica de la explosin de la supernova 1987A.
(a) Calcule la probabilidad de realizar esta observacin si en promedio se detectan 2 neutrinos
por da.
(b) Calcule la probabilidad de la observacin teniendo en cuenta que los ocho neutrinos se ob-
servaron en el espacio de 10 minutos.
(a) = 2 neutrinos.dia1
Utilizando la ecuacin 4.11
1 x
P (X = x) = e (4.14)
x!
1 8 2
P (X = 8) = 2 e = 9,0 104 (4.15)
8!
La probabilidad es muy baja. Puede esperarse una correlacin entre la explosin de la supernova
y la deteccin de los neutrinos.
2
(b) En este caso = 246 = 0,014
Utilizando de nuevo la ecuacin 4.11
1
P (X = 8) = 0,0148 e0,014 = 3,3 1020 (4.16)
8!
La ocurrencia del suceso obsevado es extremadamente improbable y posiblemente se correlacio-
ne con la explosin de la supernova u otro proceso no observado.

56
4 4. Distribuciones de probabilidad de variables aleatorias discretas

4.3.1. La distribucin de Poisson como lmite de la distribucin binomial


La distribucin de Poisson tambin representa el lmite de la distribucin binomial cuando el n-
mero de xitos es mucho menor que el nmero de ensayos (  n), es decir n grande y probabilidad
de un xito muy baja (p  1)

Ejemplo 8. Clculo de probabilidades: comportamientos lmite


La probabilidad de que un individuo sufra una reaccin al inyectarle un suero es 0.001. Deter-
minar la probabilidad de que de un total de 2000 personas ms de dos individuos sufran una
reaccin
El caso descrito corresponde a un experimento de Bernouilli con = np = 2000 0,001 = 2.
Utilizar la ecuacin 4.4
n!
PB (X = x; n, p) = px q nx (4.17)
x!(n x)!
no es un mtodo razonable para calcular probabilidades de ocurrencia.
Teniendo en cuenta que = = 2  2000 podemos utilizar en nuestros clculos la ecuacin
4.11
1 x
P (X = x) = e (4.18)
x!
La probabilidad de que ms de dos individuos sufran reaccin viene dada por

P (X > 2) =1 P (X 2) = P (0) + P (1) + P (2)


 0 2
21 e2 22 e2

2 e
= + + = 0,323
0! 1! 2!

57
4.3 4.3. Distribucin de Poisson

4.3.2. La distribucin de Gaussiana o normal como lmite de la distribucin


de Poisson
Para valores grandes de la funcin de distribucin de Poisson puede aproximarse mediante una
distribucin de probabilidad gaussiana con = y 2 = .

Figura 4.1: Distribuciones de Poisson para distintos valores de . Observe como la forma de la distri-
bucin se aproxima a distribucin normal conforme aumenta el valor de .

58
4 4. Distribuciones de probabilidad de variables aleatorias discretas

Figura 4.2: Relacin entre las distribuciones binomial, Poisson y Gauss o normal.

4.4. Ejercicios y problemas


Cuestin 4.1 Considere una distribucin binomial PB (x; n, p) con n = 6, y p=0.5.
Calcule su media.

Cuestin 4.2 Considere una distribucin binomial PB (x; n, p) con n = 6, y p=0.5.


Calcule la varianza.

Cuestin 4.3 Considere una distribucin binomial PB (x; n, p) con n = 6, y p=0.25.


Calcule su media.

Cuestin 4.4 Considere una distribucin binomial PB (x; n, p) con n = 6, y p=0.25.


Calcule la varianza.

Cuestin 4.5 En la realizacin de un programa informtico el nmero de errores cometidos por


pgina sigue una distribucin de Poisson de varianza 2.
Cul es la probabilidad de no cometerlos en un programa de 20 pginas?

59
4.4 4.4. Ejercicios y problemas

Ejercicios de repaso
Ejercicio 4.1 En la teora cintica de los gases, la probabilidad de que una molcula de un gas ideal
tenga una velocidad entre v y v + dv est dada por
mv 2
P (v) = cv 2 e 2kT dv
donde k es la constante de Boltzmann y T la temperatura en Kelvin del gas.
Determine (a) la constante c, (b) la velocidad media y (c) la velocidad ms probable.
Nota: Para resolver el problema utilice una tabla de integrales.

Ejercicio 4.2 La duracin en horas de un componente elctrico es una variable aleatoria con una
funcin de distribucin acumulada dada por
x
1 e 50 x > 0

F (X) =
0 x0
Determine:(a)la funcin densidad de probabilidad y (b) la probabilidad de que la duracin del com-
ponente exceda las 70 horas.

Ejercicio 4.3 Calcular la varianza de g(x) = 2x + 3, donde X es una variable aleatoria con distri-
bucin de probabilidad

x 0 1 2 3
1 1 1 1
f(x) 4 8 2 8

Ejercicio 4.4 Sea X una variable aleatoria con la siguiente distribucin de probabilidad:

x -3 6 9
1 1 1
f(x) 6 8 2

Calcule g (x) donde g(x) = (2x + 1)2 .

Distribucin binomial
Ejercicio 4.5 Se considera una variable aleatoria de Bernoulli que toma el valor 1 con probabilidad
0.01. Se toma una muestra de tamaoo n.
Calcular el valor mnimo que debe tener n para que la probabilidad de obtener al menos una vez
como resultado un 1 sea mayor o igual que 0.95.

Ejercicio 4.6 Si la probabilidad de que el vapor se condense en un tubo de aluminio de cubierta


delgada a 10 atm de presin es de 0.40, si se prueban 12 tubos de ese tipo y bajo esas condiciones,
determine la probabilidad de que: a) el vapor se condense en 4 de los tubos, b) en ms de 2 tubos se
condense el vapor, c) el vapor se condense en exactamente 5 tubos.

60
4 4. Distribuciones de probabilidad de variables aleatorias discretas

Ejercicio 4.7 La probabilidad de que el nivel de ruido de un amplificador de banda ancha exceda de
2 dB (decibelios) es de 0.15, si se prueban 10 amplificadores de banda ancha, determine la probabi-
lidad de que; a) en solo 5 de los amplificadores el nivel de ruido exceda los 2 dB, b) por lo menos en
2 de los amplificadores, el ruido exceda de 2 dB, c) encuentre el nmero esperado de amplificadores
que se exceden de un nivel de ruido de 2 dB y su desviacin estndar.

Ejercicio 4.8 En un experimento se comprob que la aplicacin de un tratamiento qumico aumen-


taba la resistencia a la corrosin de un material en un 80 % de los casos.
Si se tratan ocho piezas, determine
(i) Probabilidad de que el tratamiento sea efectivo para ms de cinco piezas.
(ii) Probabilidad de que el tratamiento sea efectivo para al menos tres piezas.
(iii) Nmero de piezas para las que espera que el tratamiento sea efectivo.

Ejercicio 4.9 Considere el espectro de masas de un halocarburo Cn H2n+2x Clx con x = 1,2 y 3.
Suponiendo que n = 3 y que dispone de una muestra en la que los tres compuestos estn presentes en
igual concentracin, determine las masas en las que esperara encontrar un pico en el espectro y la
intensidad relativa de los picos. Tenga en cuenta que el cloro presenta dos istopos Cl35 y Cl37 con
abundancias relativas 0.67 y 0.33 respectivamente. Suponga que todo el hidrogeno y el carbono de
las muestras corresponde a los istopos H1 y C12 .

Ejercicio 4.10 Se dispone de un cristal que tiene dos tipos de impurezas que absorben radiacin de
la misma longitud de onda. Una de ellas emite un electrn tras la absorcin de un fotn, mientras
que la segunda no emite electrones. Las impurezas estn en igual concentracin y distribuidas ho-
mogeneamente en el cristal. Sin embargo, la seccin eficaz de absorcin, que es una medida de la
probabilidad de absorber un fotn, es 90 veces mayor para la impureza que emite electrones que el
de la impureza que no los emite.
Suponiendo que sobre el cristal inciden 200 fotones y que este es lo suficientemente grande para
absorber todos, calcule la probabilidad de que al menos se emitan tres electrones.

Distribucin de Poisson
Ejercicio 4.11 Si un banco recibe en promedio 6 cheques sin fondo por da, cules son las proba-
bilidades de que reciba, a) cuatro cheques sin fondo en un da dado, b) 10 cheques sin fondos en
cualquiera de dos das consecutivos?

Ejercicio 4.12 En la inspeccin de una hojalata producida por un proceso electroltico continuo, se
identifican 0.2 imperfecciones en promedio por minuto.
Determine las probabilidades de identificar a) una imperfeccin en 3 minutos, b) al menos dos
imperfecciones en 5 minutos, c) un mximo de una imperfeccin en 15 minutos.

Ejercicio 4.13 Consideremos que el nmero de trozos de chocolate en una determinada galleta sigue
una distribucin de Poisson. Queremos que la probabilidad de que una galleta seleccionada al azar
tenga por lo menos tres trozos de chocolate sea mayor que 0.8.
Encontrar el valor entero ms pequeo de la media de la distribucin que asegura esta probabi-
lidad.

61
4.4 4.4. Ejercicios y problemas

Ejercicio 4.14 La variable X representa el nmero de llamadas a un telfono en una hora y sigue
una distribucin de Poisson con parmetro igual a 3,5.
(a) Calcular la probabilidad de que no se produzcan llamadas en la prxima hora.
(b) Hallar la probabilidad de que se reciban al menos dos llamadas en las dos prximas horas.
(c) Cunto tiempo podemos estar fuera si se quiere que la probabilidad de que el telfono suene
en nuestra ausencia sea como mximo 0,5?

Aproximacin de la distribucin binomial a la distribucion de Poisson


Ejercicio 4.15 Un fabricante de maquinaria pesada tiene instalados en el campo 3840 generadores
de gran tamao con garanta. S la probabilidad de que cualquiera de ellos falle durante el ao dado
es de 1/1200 determine la probabilidad de que a) 4 generadores fallen durante el ao en cuestin, b)
que ms 1 de un generador falle durante el ao en cuestin.

Ejercicio 4.16 Se sabe que el 5


Determine la probabilidad de que 2 de 100 libros encuadernados en ese taller, tengan encuader-
naciones defectuosas, usando, la aproximacin de Poisson a la distribucin binomial

Ejercicio 4.17 En un proceso de manufactura, en el cual se producen piezas de vidrio, ocurren de-
fectos o burbujas, ocasionando que la pieza sea indeseable para la venta. Se sabe que en promedio
1 de cada 1000 piezas tiene una o ms burbujas. Cul es la probabilidad de que en una muestra
aleatoria de 8000 piezas, menos de 3 de ellas tengan burbujas?

4.4.1. Soluciones a los ejercicios


Distribucin binomial
Ejercicio 4.5 De acuerdo con el problema si llamanos xito a obtener 1 tendremos p = 0,01 y
q = 0,99.
Sea S = nmero de xitos en n ensayos Bernoulli

PB (S 1; n, 0,01) = 1 PB (S < 1; n, 0,01) = 1 PB (S = 0; n, 0,01)


Utilizando la ecuacin 4.4

n!
PB (X = x; n, p) = px q nx (4.19)
x!(n x)!

n!
PB (S 1; n, 0,01) = 1 PB (S < 1; n, 0,01) = 1 0,010 0,99n = 1 0,99n 0,95 (4.20)
0!n!

log 0,05
1 0,99n 0,95 0,05 0,99n log 0,05 n log 0,99 n ' 299 (4.21)
log 0,99

62
4 4. Distribuciones de probabilidad de variables aleatorias discretas

Ejercicio 4.6 a) n = 12
x representa la variable que define el nmero de tubos en que el vapor se condensa
x = {0, 1, 2, 3, . . . , 12}
exito: p = P (se condense el vapor en un tubo de Al a 10 atm) = 0,40
fracaso: q = P (no se condense el vapor en un tubo de Al a 10 atm) = 1 p = 0,60 = 0,21284

PB (X = {3, 4, ..., 12}; 12, 0,40) = P (x = 3)+P (x = 4)+. . .+P (x = 12) = 1P (X = {0, 1, 2}; 12, 0,40) =

Utilizando la ecuacin 4.4 se obtiene

PB (X 3; 12, 0,40) = 1 (0,002176 + 0,0174096 + 0,06385632) = 1 0,08344192 = 0,91656

c) PB (X = 5; 12, 0,40) = 0,22703

Ejercicio 4.7 a) n = 10
x representa la variable que define el nmero de amplificadores de banda ancha que su nivel de
ruido excede de 2 dB, x = {0, 1, 2, 3, . . . , 10}.
exito: p = P (un amplificador exceda su nivel de ruido de 2 dB) = 0,15
fracaso: q = P (un amplificador no exceda su nivel de ruido de 2 dB) = 1 p = 0,85
PB (X = 5; 10, 0,15) = 0,00849
b) PB (X 2; 10, 0,15) = 1 PB (X 1; 10, 0,15) = 1 (0,1968 + 0,3474) = 1 0,5444 =
0,4557
c) = np = 1,5 = 2, se espera que 2 de los 10 amplificadores probados se excedan de un nivel
de ruido de 2 dB.

= npq = 1,1291 =1

Distribucin de Poisson
Ejercicio 4.11 a) x representa la variable que define el nmero de cheques sin fondo que llegan al
banco en un da cualquiera, x = {0, 1, 2, 3, . . .}. = 6 es el nmero medio de cheques sin fondo por
da.
La probabilidad de recibir cuatro cheques sin fondo en un dia puede calcularse con la ecuacin
4.11
1 x
P (X = x) = e (4.22)
x!
1 4 6 1296 0,00248
P (X = 4) = 6e = = 0,13392
4! 24
b) x representa la variable que define el nmero de cheques sin fondo que llegan al banco en un
da cualquiera, x = {0, 1, 2, 3, . . .}. = 2 6 = 12 es el nmero medio de cheques sin fondo por
da.
Utilizando de nuevo la ecuacin 4.11 obtenemos

1 1 10 6,1973691010 6,151106
P (X = 10) = 12 0e = = 0,104953
10! 3628800

63
4.4 4.4. Ejercicios y problemas

Ejercicio 4.12 a) x representa la variable que define el nmero de que nos define el nmero de
imperfecciones en la hojalata cada 3 minutos x = {0, 1, 2, 3, . . .} . = 0,2 3 = 0,6 es el nmero
medio de imperfecciones en tres minutos.
Utilizando de nuevo la ecuacin 4.11 obtenemos
1 1 0,6 0,6 0,548845
P (X = 1) = 0,6 e = = 0,329307
1! 1
b) x representa la variable que define el nmero de que nos define el nmero de imperfecciones
en la hojalata cada 5 minutos x = {0, 1, 2, 3, . . .} . = 0,2 5 = 1 es el nmero medio de
imperfecciones en tres minutos.
Utilizando de nuevo la ecuacin 4.11 obtenemos

P (X 2) = P (X = 2, 3, . . .) = 1 P (X 1) = 1 P (0) P (1)
 
1 0 1 1 1 1
P (X 2) = 1 1e + 1e = 1 (0,367918 + 0,36718) = 0,26416
0! 1!
c) x representa la variable que define el nmero de que nos define el nmero de imperfecciones
en la hojalata cada 15 minutos x = {0, 1, 2, 3, . . .} . = 0,2 15 = 3 es el nmero medio de
imperfecciones en tres minutos.
Utilizando de nuevo la ecuacin 4.11 obtenemos

1 0 3 1 1 3
P (X 1) = P (X = 0) + P (X = 1) = 3 e + 3 e = 0,0498026 + 0,149408 = 0,1992106
0! 1!
Ejercicio 4.13 Sea X = nmero de trozos de chocolate en una galleta donde queremos evaluar P (X >
3; ) > 0,8

e 2 e
P (X > 3) = 1 P (X 2) = 1 P (0) P (1) P (2) = 1 e
1 2
Dando valores a = 1, 2, ..., 5 se obtiene

0 1 2 3 4 5
P (X > 3) 0.0803014 0.3233236 0.5768099 0.7618967 0.8753480

El valor ms cercano a 0,8 lo proporciona = 4.

64
4 4. Distribuciones de probabilidad de variables aleatorias discretas

4.5. Lecturas recomendadas


Para completar la preparacin de este tema recomendamos la lectura de:

Captulo 1. Magnitudes aleatorias y sus caractersitcas. del texto de Spiridonov y Lopatkin[7].


X
Revisa los contenidos del tema. Adecuado para revisar la teora del tema.

Captulo 4. Distribuciones de Probabilidad especial del libro de Spiegel y cols.[5].


Se recomienda revisar los ejercicios resueltos:

Distribucin binomial 4.1 a 4.6, y 4.9X


Distribucin de Poisson 4.22 X

Como ejercicios de repaso se recomienda realizar los ejercicios:

Distribucin binomial 4.63, 4.64, 4.65,4.67, 4.68, 4.69


Distribucin de Poisson 4.90, 4.93

Los comportamientos lmite de estas distribuciones binonial y de Poisson se estudiarn en el


tema 5.

Captulo 4. Algunas distribuciones discretas de probabilidad. del texto de Walpole y Myers[6].

65
5

Distribuciones de probabilidad de variables aleatorias


continuas

Contenidos Distribucin uniforme Descripcin y propiedades.


Distribucin normal o gaussiana Descripcin y propiedades. Descrip-
cin y propiedades. Distribucin de las medias de muestras de tamao
finito. Teorema del lmite central. Intervalos de confianza para la media
muestral. Aproximacin de la distribucin binomial y de Poisson a la dis-
tribucin normal.
Distribucin t de Student Descripcin y propiedades.
Distribucin 2 Descripcin y propiedades. Intervlos de probabilidad
para la varianza muestral.
Distribucin F de Fisher Descripcin y propiedades. Comparacin de
varianzas.

Objetivos Reconocer las caractersticas de la distribucin uniforme de una variable


aleatoria continua
Reconocer las caractersticas de una distribucin normal o gaussiana.
Realizar clculos de probabilidades de variables aleatorias que siguen un
distribucin normal
Comprender el significado de los intervalos de probabilidad 2 y 3 de una
variable alaeatoria normal
Conocer las caractersticas de la distribucin de medias muestrales una
variable aleatoria normal
Comprender las consecuencias del teorema del lmite central y sus limita-
ciones
Utilizar la distribucin normal para calcular intervalos de probabilidad de
variables que siguen una distribucin binomial o de Poisson

67
5.0

Objetivos Reconocer las caractersticas de una distribucin t de Student


Calcular intervalos de probabilidad de variables que siguen una distribucin
t de Student
Determinar los lmites del intervalo de confianza de la media muestral
Reconocer las caractersticas de una distribucin 2 de Student
Utilizar la distribucin 2 para calcular intervalos de confianza de la va-
rianza muestral
Reconocer las caractersticas de una distribucin F de Fisher
Utilizar la distribucin F de Fisher para la comparacin de varianzas mues-
trales
Conocer las diferencas entre hiptesis nula, H0 , e hiptesis alternativa, H1 ,
y la relacin de ambas con los intervalos de probabilidad

68
5 5. Distribuciones de probabilidad de variables aleatorias continuas

5.1. Distribucin uniforme


Una variable aleatoria X sigue una distribucin uniforme en el intervalo [a,b] cuando su funcin
densidad de probabilidad es

0 x<a
1
f (x) = ba
axb (5.1)
0 x>b

Su funcin de densidad de probabilidad integrada es



0 x<a
xa
F (x) = ba
axb (5.2)
1 x>b

La media y la varianza de la distribucin vienen dadas por

a+b
= (5.3)
2

(b a)2
2 = (5.4)
12

Esta distribucin slo depende de los parmetros a y b que estn comprendidos en el intervalo
(, +).

Figura 5.1: Distribucin de densidad de probabilidad de una variable uniforme continua.

69
5.2 5.2. Distribucin normal o Gaussiana

5.2. Distribucin normal o Gaussiana


La funcin de densidad de probabilidad de una variable x que sigue una funcin de distribucin
normal o gausiana viene dada por

1 (xx )2

f (x) = e 22 (x) (5.5)
2 (x)

donde x y (x) son la media y la desviacin tpica de X respectivamente, y la variable alatoria puede
estar comprendida en el intervalo < x < +.
Si una variable aleatoria sigue una distribucin normal slo necesitamos conocer x y (x) para
caracterizar la distribucin de los datos.
La funcin de distribucin de probabilidad viene dada por
Z x (xx )2
1
F (x) = P (x x) = e 2 2 (x) dx (5.6)
2 (x)

En el trabajo con variables aleatorias que siguen una distribucin normal es conveniente utilzar la
variable normalizada z, que se calcula como

x x
z= (5.7)
(x)

Esta variable tiene la ventaja de que cualesquiera sean los valores de x y (x), z siempre si-
gue una distribucin normal con media z = 0 y desvicin tpica (z) = 1. En general f(z) o F(z)
se evaluan utilizando un programa informtico o utilizando tablas1 (ver apndices).Por comodidad
utilizaremos tablas e ilustraremos su uso en los ejemplos.

Figura 5.2: Distribucin de densidad de probabilidad de Gauss estanzarizada.

1
En la tabla del apndice correspondiente a la distribucin normal se tabula P(0<Z<z).

70
5 5. Distribuciones de probabilidad de variables aleatorias continuas

Figura 5.3: Distribucin de densidad de probabilidad de Gauss con idntica media x = 0 y distinta
varianza 2 (x) = 1 (lnea continua) y 2 (x) = 0,25 (lnea discontinua).

Ejemplo 1. Clculo de probabiblidades de una variable normal (I)


Hallar la probabilidad de que la magnitud aleatoria z (z =0, (z)=1) este comprendida en el
intervalo (-1.96,1.96).
Teniendo en cuenta los postulados que definen la probabilidad:

P (1,96 z 1,96) = P (1,96 z 0) + P (0 z 1,96)


La distribucin gausiana es una distribucin simtrica

P (z Z) = P (z Z)

P (1,96 z 1,96) = 2 P (0 z 1,96)


De acuerdo con el apndice 1

P (0 Z 1,96) = 0,475
y

P (1,96 Z 1,96) = 2 0,475 = 0,990

71
5.2 5.2. Distribucin normal o Gaussiana

Figura 5.4: Distribucin de densidad de probabilidad de Gauss que difieren en la media x = 0 y


x = 1 pero tienen idntica 2 (x) = 1.

Ejemplo 2. Clculo de probabiblidades de una variable normal (II)


Hallar la probabilidad de que el resultado de una observacin nica de una variable aleatoria
distribuida normalmente no exceda la media en ms de 2.
El problema nos pide que calculemos P ( 2 x + 2).
Para calcular la probabilidad primero determinaremos los valores de la variable tipificada que
corresponden a los lmites del intervalo xmin = x 2(x) y xmax = x + 2(x)

x x (x 2(x)) x
z = = = 2
(x) (x)
Como disponemos de una tabla de la distribucin gausiana estandarizada (ver apendice 1) que
nos proporciona P (0 x z), utilizaremos la simetra de la distribucin gaussina para calcular
P (0 z 2):

P (x 2 z x + 2) = P (2 z 2) = 2P (0 z 2)
Consultando el apndice 1 obtenemos

P (0 z 2) = 0,4772

72
5 5. Distribuciones de probabilidad de variables aleatorias continuas

de modo que

P (2 z 2) = 2 0,4772 = 0,9544

De acuerdo con el ejemplo anterior, si las observaciones (medidas) cumplen la ley de distribucin
normal, la probabilidad de que el resultado de una medida este en el intervalo 2 es 0.9544. De
modo anlogo se deduce que la probabilidad de que se obtenga una observacin en el intervalo 3
es 0.9974. De esto se deduce que la probabilidad de que las observaciones se encuentren fuera de estos
intervalos son muy pequeas, 0.046 y 0.0026, respectivamente. Por ello, las magnitudes 2 y 3 se
utilizan con frecuencia para determinar el error mximo admisible y despreciar resultados fuera de
estos intervalos. Sin embargo, hay que tener en cuenta que (x) hace referencia a la desviacin tpica
poblacional. En general slo tenemos una estima de esta magnitud, la desviacin tpica muestral,
s(x). Como veremos ms adelante, esto nos obliga a utilizar la distribucin t de Student para calcular
los lmites del error admisible.

Figura 5.5: Representacin de un conjunto de 5000 medidas de la temperatura que siguen una distri-
bucin normal. Como puede observar, la mayor parte de los datos estn concentrados en el intervalo
x 2(x), y es escaso el nmero de datos fuera del intervalo x 3(x).

73
5.2 5.2. Distribucin normal o Gaussiana

Ejemplo 3. Clculo de probabiblidades de una variable normal (III)


Calcule la probabilidad de que la concentracin de cloruros, c, en una muestra de agua este en
el intervalo 31,50 a 38,50 mg/l si la concentracin media de cloruros es 35,00 mg/l con una
desviacin tpica de 3,5 mg/l.
Calculamos la variable normal tipificada que corresponde a cada uno de los lmites del intervalos:
31,5 35
zmin = = 1,0
3,5
38,5 35
zmax = = 1,0
3,5
de modo que

P (28,5 c 38,5) = P (1 z 1) = 2 P (0 z 1) = 0,6826


Este resultado supone que si nuestros resultados siguen una distribucin normal, esperamos que
el 68.26 % de las medidas se encuentren en el intervalo x (x). En el caso estudiado este
intervalo comprende las concentraciones 28,5 c 38,5 mg/l.

Ejemplo 4. Clculo de probabiblidades de una variable normal (IV)


Cierta magnitud X sigue una distribucin normal de media 3 y varianza 4. Cul es la probabili-
dad de observar los resultados X > 3.5, X < 1.2 y 2.5 <X < 3.5?.

P (X > 3,5) =P (Z > 0,25) = 1 P (Z < 0,25)


=0,5 P (0,00 Z 0,25) = 0,4013

P (X < 1,2) =P (Z < 0,9) =


=0,5 P (0,9 Z 0,0)
=0,5 P (0,0 Z 0,9) = 0,1841

P (2,5 < X < 3,5) =P (0,25 < Z < 0,25)


=P (0,25 Z 0,0) + P (0,0 Z 0,25)
=2 P (0,0 Z 0,25) = 2 0,0987 = 0,1974

74
5 5. Distribuciones de probabilidad de variables aleatorias continuas

5.2.1. Qu variables aleatorias siguen una distribucin normal?


La media muestral x de una variable X que sigue una distribucin normal

Teorema 5.1
Si una variable aleatoria x1 sigue una distribucin normal de media 1 y varianza 12 , y otra variable
aleatoria x2 sigue una distribucin normal de media 2 y varianza 22 , y ambas son independientes, la
variable aleatoria x3 = x2 x1 sigue una distribucin normal de media 3 y varianza 32

3 =1 + 2 (5.8)
32 =12 + 22 (5.9)

Esta propiedad puede extenderse a la suma de n variables aleatorias independientes distribuidas


normalmente.

Corolorario 5.1
La variable aleatoria media muestral x de muestras de tamao n de una variable aleatoria X que sigue
una distribucin normal

f (x) = PN (x; x , (
x))
de media x

x = x (5.10)

y varianza, 2 (
x)

2 (x)
2 (
x) = (5.11)
n

En este caso la magnitud tipificada z viene dada por


x x x x
z= = (5.12)
(
x) (x)/ n

75
5.2 5.2. Distribucin normal o Gaussiana

Figura 5.6: Funciones de densidad de probabilidad gaussianas. Comparacin de la distribucin de los


datos (negra) y las distribucin de las medias de muestras de tamao n (azul).

Ejemplo 5. Clculo de probabiblidades de una variable normal: distribucin de las medias

Una aleacin de cobre contiene una media de 41.26 % de este metal (determinado como la media
de las determinaciones de varios laboratorios) con una desviacin tpica de 0.12 %.
Cul es la probabilidad de que al realizar un anlisis de nueve muestras se obtengan porcentajes
de cobre entre el 41.30 % y el 41.50 %?. Y se tomaran diecisis muestras?.
En este ejemplo (x) = 41,26 y (x) = 0,12 , donde x es el resultado de la medida. De acuerdo
con el corolario 5.1,x esta distribuido normalmente con media x = x = 41,26 y desviacin
tpica (
x) = (x)/ n tendremos
(a) con nueve muestras
0,12
x) = = 0,04
(
9
y las variables tipificadas correspondientes sern:
x x
z=
(x)/ n
x1 x 41,30 41,26
z= = = 1,0
(x)/ n 0,04
x2 x 41,50 41,26
z= = = 6,0
(x)/ n 0,04

76
5 5. Distribuciones de probabilidad de variables aleatorias continuas

Figura 5.7: Distribucin de frecuencias de las medias muestrales de conjuntos de n medidas de una
variable que sigue una distribucin gaussiana. En todos los diagramas se utilizaron las mismas 500
medidas pero se utilizaron distinto nmero de medidas para calcular las medias, n = (a) 1, (b)5, (c)
10, y (d) 25.

de modo que

P (1,0 z 6,0) = P (z 6,0) P (z 1,0) = 1,0000 0,8413 = 0,1587


(b) con dieciseis muestras
0,12
x) = = 0,03
(
16
y las variables tipificadas correspondientes sern:
x1 x 41,30 41,26
z= = = 1,33
(x)/ n 0,03
x2 x 41,50 41,26
z= = = 8,0
(x)/ n 0,03
de modo que

P (1,33 z 8,0) = P (z 8,0) P (z 1,33) = 1,0000 0,9082 = 0,0918

77
5.2 5.2. Distribucin normal o Gaussiana

La media muestral x de cualquier variable aleatoria obtenida a partir de un nmero grande de


medidas
Teorema 5.2
Teorema del lmite central. Sean las magnitudes aleatorias x1 , x2 , . . ., xn que siguen la misma distri-
bucin de probabilidad y a la que corresponde una media x y una varianza 2 (x) finitas. Conforme
aumenta el valor de n la distribucin de la variable aleatoria media muestral, x se aproxima a una
distribucin normal de media x y varianza 2 (x)/n.
La importancia de este teorema estriba en que permite, si la muestra es lo suficientemente grande,
calcular estimas aceptables de y 2 (x) sin necesidad de conocer f(x).
Matemticamente esta es una ley asinttica, es decir, la identidad con la distribucin gaussiana
slo se consigue si la poblacin original es normal, pero su comportamiento es muy prximo a ste
conforme aumenta el tamao de la muestra n utilizada para calcular estas estimas.

Figura 5.8: Distribucin de frecuencias de las medias muestrales de n medidas de un conjunto de 500
datos que siguen una distribucin uniforme. En la figura puede observarse como la distribucin evo-
luciona desde la distribucin uniforme n = 1 ha distribuciones de tipo gaussiano conforme aumenta
n. En todos los diagramas se utilizaron las mismas 500 medidas pero estas se agruparon en conjuntos
de distinto tamao, n, para calcular las medias, n = (a) 1, (b)5, (c) 10, y (d) 25.

78
5 5. Distribuciones de probabilidad de variables aleatorias continuas

Una variable discreta que sigue una distribucin binomial cuando el nmero de experimentos,
n, es grande
De acuerdo con el teorema de Moivre, para tamaos de la muestra tales que los valores del produc-
to npq >5 (tamaos de muestra grnades), el comportamiento de la distribucin binomial se asemeja al
de una distribucin normal con media = np y varianza 2 = npq. Esta propiedad es conocida como
teorema de Moivre.
Como la distribucin binomial es una distribucin de variables discretas, hay que hacer una correc-
cin de continuidad de modo que al utilizar la aproximacin de la distribucin binomial a una distri-
bucin gaussiana las probabilidades se calculan como

PB (X = a; n, p) =PG (a 0,5 X a + 0,5)


PB (a < X < b; n, p) =PG (a + 0,5 X b 0,5)
PB (a X b; n, p) =PG (a 0,5 X b + 0,5)

Este teorema permite calcular de una manera sencilla valores de la probabilidad de una distribu-
cin binomial en condiciones en las que es imposible evaluar esta magnitud utilizando la ecuacin
4.4
n!
PB (X = x; n, p) = px q nx (5.13)
x!(n x)!

Figura 5.9: Distribucin de probabilidad para una variable binomial con n = 25, p = 0,5 y q = 0,5 y
la distribucin normal con x = np = 12,5 y 2 (x) = npq = 6,25.

79
5.3 5.3. La distribucin t de Student

Una variable discreta que sigue una distribucin de Poisson con grande
Para valores grandes de la funcin de distribucin de Poisson puede aproximarse mediante una
distribucin de probabilidad gaussiana con = y 2 = .

Figura 5.10: Relacin entre las distribuciones binomial, Poisson y Gauss o normal.

5.3. La distribucin t de Student


Una variable aleatoria continua t, que puede tomar valores en el intervalo 0 t < y tiene una
funcin densidad de probabilidad
 +1
1 +1 t2 ( 2 )

2
f (t) = 1+ (5.14)
2

se dice que est distribuida de acuerdo con una distribucin t de Student con grados de libertad2 .
Es importante observar en la ecuacin 5.14 que la funcin de distribucin est completamente
caracterizada por un solo parmetro: el nmero de grados de libertad.
La media no depende del nmero de grados de libertad y es

t = 0 (5.15)

mientras que la varianza slo depende del nmero de grados de libertad



2 (t) = (5.16)
2

Cuando es grande, 2 (t) 1. Adems, puede demostrarse que para valores grandes de (
20) se puede considerar a la funcin t de Student se comporta como una distribucin normal de media
0 y varianza 1.
R
2
En la expresin de f(t), (z) es la funcin gamma de Euler, que viene dada por (z) = 0
z1 e d con > 0

80
5 5. Distribuciones de probabilidad de variables aleatorias continuas

Figura 5.11: Distribucin t de Student con distintos grados de libertad.

5.3.1. Qu variables aleatorias siguen una distribucin t de Student?


Teorema 5.3
Sean Z e Y dos variables aleatorias independientes. Si Y est normalmente distribuida con media 0 y
varianza 1, mientras que Z tiene una distribucin chi-cuadrado 2 con grados de libertad. Entonces
la variable aleatoria T

y
T =p (5.17)
z/

sigue una distribucin t de Student con grados de libertad.

Utilizando este teorema se puede demostrar que la variable aleatoria t definida como

x x x x
t= = (5.18)
s(
x) s(x)/ n

est distribuida con arreglo a una distribucin t de Student con = n 1 grados de libertad.
En el apndice 2 se proporcionan los valores de las percentilas tp para distribuciones t de Student
con grados de libertad. La percentila es el valor que toma la variable aleatoria, t en nuestro caso,
para que se cumpla que

P (t() tp ()) = p (5.19)

81
5.3 5.3. La distribucin t de Student

Ejemplo 6. Clculo del intervalo de probabiblidad de una variable que sigue la distribucin
t de Student
Usando la tabla del apndice A.2 determine el intervalo simtrico en el que se encontrar la
variable t con una probabilidad del 95 % si tienen =9 grados de libertad.
En este ejemplo nos piden determinar lOS valores de t que cumplan

P (t1 () t t2 ()) =0,95


P (t t1 ()) =0,025
P (t t2 ()) =0,025

En las tablas del apndice A.2 podemos encontrar los valores de tp tales que

P (t() tp ()) = p
que equivalen a los valores para los que

P (t() tp ()) = 1 p
Teniendo en cuenta que la distribucin t de Student es simtrica respecto de su media y que
t = 0, para un intervalo tambin simtrico tendremos

P (t 1+p () t t 1+p ()) = p


2 2

En este ejemplo, p = 0,95 y = 9. En la tabla del apndice A.2 encontramos t,975 (9) = 2,26,
de modo que el intervalo de probabilidad viene dado por

t,975 t t,975

2,26 t 2,26

82
5 5. Distribuciones de probabilidad de variables aleatorias continuas

Ejemplo 7. Clculo del intervalo de confianza de la media


En un experimento para la determinacin de cloruros se utilizo una tcnica cromatogrfica. En
esta tcnica la concentracin de la especie detectada es proporcional al rea del pico asociado a
la especie detectada. En un anlisis de 9 muestras de agua de lluvia se obtuvo un valor medio del
rea x = 0,6752 cm2 y una desviacin tpica s(x) = 0,002821 cm2 .
A partir de estos datos, determine el intervalo de valores en que espera que se encuentre el valor
medio del rea con una probabilidad de 0.95.
Si la media de las reas de los picos siguen una distribucin gaussiana, la variable t, ecuacin
5.18,
x x x x
t= = (5.20)
s(
x) s(x)/ n
seguir una distribucin t de Student con = 9 1 = 8 grados de libertad.
Por tanto esperamos que

P (t,975 (8) t t,975 (8)) = 0,95


y

x x
t,975 (8)
s(x)/ n
x x
t,975 (8)
s(x)/ n

s(x)
x t,975 (8) x
n
s(x)
x x + t,975 (8)
n

De donde sigue que esperamos que la media se encuentre en el intervalo

s(x) s(x)
x t,975 (8) x x + t,975 (8)
n n
0,002821 0,002821
0,6752 2,31 x 0,6752 + 2,31
9 9

0,6730 x 0,6772
con una probabilidad de 0.95.
Es habitual expresar este intervalo como x = 0,6752 0,0021.

83
5.4 5.4. La distribucin 2

5.4. La distribucin 2
Se dice que una variable aleatoria sigue una distribucin chi-cuadrado o 2 con grados de
libertad si su funcin de distribucin de probabilidad tiene la forma
(
0 si x < 0
P (2 x) x (5.21)
1 u 2 1 e 2 du si x > 0
R
2( ) 0
2

Note que la funcin de distribucin esta caracterizada por un slo parmetro, .


Para esta distribucin

2 = (5.22)

2 (2 ) = 2 (5.23)

Figura 5.12: Distribuciones 2 con distintos grados de libertad, .

En el apndice 3 se recogen los valores de las percentilas de distribuciones 2 con grados de


libertad, es decir

P (2 () X 2 ) = 2p () = p (5.24)

5.4.1. Qu variables aleatorias siguen una distribucin 2 ?


Teorema 5.4
Suponga que dispone de n magnitudes aleatorias independientes x1 , x2 , x3 , . . ., xn distribuidas de
acuerdo con una distribucin normal de parmetros x y (x).
Si definimos la variable Ui tal que
x i x
Ui = (5.25)
(x)

84
5 5. Distribuciones de probabilidad de variables aleatorias continuas

la suma

n n
2
X X (xi x )2
= Ui2 = (5.26)
i=1 i=1
2 (x)

est distribuida de acuerdo con una distribucin 2 con = n grados de libertad.

A partir de este teorema se puede demostrar que la variable aleatoria X 2

s2 (x)
X 2 = (n 1) (5.27)
2 (x)

sigue una distribucin 2 con = n 1 grados de libertad.

Ejemplo 8. Intervalos de probabilidad de variables que siguen una distribucin 2


Suponga que hace cinco medidas de una cantidad distribuida normalmente con media = 0,05
y se obtienen los valores 0.041, 0.064, 0.055, 0.046, 0.060.
Estime la varianza de la distribucin. Suponga que la varianza es conocida y tiene el va-
lor 2 (x) = 1,0 104 . Determine si el valor de X 2 obtenido se encuentra en el intervalo
P (20,025 () x2 20,975 ()).
P
xi 0,2666
x = = = 0,0532
n 5
(xi x)2
P
2
s (x) = = 9,17 105
n1
De acuerdo con el teorema X 2

s2 (x) 9,17 105


X 2 = (n 1) = 4 = 3,68
2 (x) 1 105
sigue una distribucin 2 con = 4 grados de libertad.
De acuerdo con las tablas del apndice A.3,

P (20,025 ( = 4) X 2 ) = 0,484

P (20,975 ( = 4) X 2 ) = 11,1
Es decir el valor de x2 obtenido est dentro del intervalo indicado

85
5.4 5.4. La distribucin 2

Ejemplo 9. Intervalos de probabilidad de la varianza muestral


Se desea contrastar la hiptesis de que la varianza de una poblacin normal es 2 (x) = 1(u.a.)2 .
Para ello se realizaron 9 medidas de esa magnitud obteniendose un valor de la varianza muestral
s2 (x) = 1,71(u.a.)2 .
Determine si este resultado es compatible con la hiptesis propuesta (hiptesis nula). Utilice
como criterio para aceptar la hiptesis nula que si la hiptesis es cierta se cumple que 20,025 ()
X 2 20,975 ().
Determine el intervalo de valores de s2 (x) compatibles con la hiptesis nula.
Calculamos el valor de la variable X 2

2 s2 (x) 1,71
X = (n 1) 2 =8 = 13,6
(x) 1,0
De acuerdo con las tablas del apndice A.3,

P (20,025 ( = 8) X 2 ) = 2,18

P (20,975 ( = 8) X 2 ) = 17,5
Ya que el criterio se cumple aceptamos la hiptesis nula.
El intervalo de valores de X 2 compatibles con la hiptesis nula vendr dado por

s2 (x)
20,025 ( = 8) (n 1) 20,975 ( = 8)
2 (x)
s2 (x)
2,18 (n 1) 17,5
2 (x)
2 (x) 2 (x)
2,18 s2 (x) 17,5
n1 n1

0,273 s2 (x) 2,192

86
5 5. Distribuciones de probabilidad de variables aleatorias continuas

Ejemplo 10. Intervalos de confianza de la varianza


En un experimento se determino la densidad de un polmero en disolucin. En el experimento
se realizaron 5 medidas y se obtuvo una varianza muestral s2 (x) = 14,1.(u.a.)2 . Determinen el
intervalo simtrico en el que espera encontrar la varianza con una probabilidad p = 0.9.
Que el intervalo sea simtrico supone que

P (21 () X 2 22 ()) =0,90


P (X 2 21 ()) =0,05
P (X 2 22 ()) =0,05

Suponiendo que las medidas estn distribuidas normalmente,

s2 (x)
20,05 ( = 4) (n 1) 20,95 ( = 4)
2 (x)
0 ,052 ( = 4) 1 0 ,952 ( = 4)

(n 1)s2 (x) 2 (x) (n 1)s2 (x)
(n 1)s2 (x) 2 (n 1)s2 (x)
(x)
20,95 ( = 4) 20,05 ( = 4)
14,1 14,1
4 2 (x) 4
9,49 0,711

5,94 2 (x) 78,8

Propiedad aditiva
Teorema 5.5
Sean X12 y X22 dos variables aleatorias independientes. Si X12 sigue una distribucin 2 con 1 grados
de libertad y X22 sigue una distribucin 2 con 2 grados de libertad, X32 = X12 + X22 sigue una
distribucin 2 con = 1 + 2 grados de libertad.

5.4.2. Relacin entre la distribucin 2 y la distribucin normal


Cuando es grande la distribucin 2 se aproxima a una distribucin normal con media = y
varianza 2 = .

87
5.5 5.5. La distribucin F de Fisher

5.5. La distribucin F de Fisher


Una variable aleatoria u est distribuida de acuerdo con una distribucin F de Fisher con 1 y 2
grados de libertad si su funcin de densidad de probabilidad est dada por

( 1 + 2
) 1 /2 2 /2 2 /21 1 +2
f (u) = 1
2
2 1 2 u (1 u 2 ) 2 (5.28)
( 2 )( 2 )
donde u > 0.
Para esta distribucin,
2
u = si 2 > 2 (5.29)
2 2

2 222 (1 + 2 2)
(u) = si 2 > 4 (5.30)
1 (2 2)2 (2 4)

5.5.1. Qu variables aleatorias de inters siguen una distribucin F de Fis-


her?
Teorema 5.6
Sean V1 y V2 dos variables aleatorias independientes distribuidas de acuerdo con distribuciones 2
con 1 y 2 grados de libertad. Entonces la variable aleatoria f dada por

V1 /1
f= (5.31)
V2 /2
sigue una distribucin F con 1 y 2 grados de libertad.
Una consecuencia de este teorema es

1
F1p (1 , 2 ) = (5.32)
Fp (2 , 1 )

88
5 5. Distribuciones de probabilidad de variables aleatorias continuas

Corolorario 5.2
Sean dos muestras aleatorias independientes de tamaos m y n, respectivamente, que se obtienen
de poblaciones normales con varianzas 12 (x) y 22 (y) respectivamente. De acuerdo con el teorema
anterior, la variable aleatoria

ms21 (x)/(m 1)12 (x)


f= (5.33)
ns22 (y)/(n 1)22 (y)

obedece una ley de Fisher con 1 = m 1 y 2 = n 1 grados de libertad.


En el caso en que 12 = 22 , la expresin anterior se simplifica a

s21 (x)
f= (5.34)
s22 (y)

Los apndices A.4 y A.5 se recogen los valores de F con 1 y 2 grados de libertad para los que
la funcin de distribucin de probabilidad iguala a 0.95 y 0.99 . Es decir se tabulan los valores de la
variable aleatoria f que cumplen:

P (f F0,95 ; 1 , 2 ) = 0,95

P (f F0,95 ; 1 , 2 ) = 0,99

Ya que en general Fp (1 , 2 ) 6= Fp (2 , 1 ), para calcular Fexp designaremos los valores de s1 y s2


de modo que s21 > s22

Ejemplo 11. Comparacin de varianzas (I)


La varianzas muestrales obtenidas al aplicar dos mtodos A y B para determinar el valor de una
magnitud son

s2 (A) =45,34 104


s2 (B) =11,11 104

En ambos experimentos se realizaron 9 medidas. Es mayor la varianza en el mtodo A que la


del mtodo B?.
Supondremos que las medidas estn distribuidas normalmente.
Formularemos la hiptesis nula H0 : 12 = 22 , de modo que si esta hiptesis es cierta, de acuerdo
con el corolario 5.2, la variable aleatoria

s2 (A)
fexp = (5.35)
s2 (B)
sigue una distribucin F con 1 = m 1 = 8 y 2 = n 1 = 8 grados de libertad.

89
5.5 5.5. La distribucin F de Fisher

Utilizaremos como criterio para aceptar esta hiptesis que el valor de fexp que obtenemos sea
razonablemente probable, es decir que este comprendida en el intervalo que comprende al 95 %
de las medidas si la hiptesis nula es cierta,

fexp F0,95 (8, 8)


Si esto no se cumple, supondremos valida la hiptesis alternativa H1 : 12 > 22 , que queremos
contrastar.
Calculamos fexp

45,34 104
fexp = = 4,0 (5.36)
11,11 104
En la tabla del apndice A.4 encontramos F0,95 (8, 8) = 3,44 de modo que fexp > F0,95 (8, 8),
rechazamos H0 , las varianzas son iguales, y aceptamos la hipotesis alternativa: la varianza del
mtodo A es mayor que la del mtodo B.

Ejemplo 12. Comparacin de varianzas (II)


Un ingeniero qumico estudi la variabilidad de dos dispositivos de monitorizacin de un proceso
dentro de una planta. En el estudio de la variabilidad de ambos equipos obtuvo el siguiente
resultado

Equipo 1. s21 = 13,5 n1 = 12


Equipo 2. s22 = 10,53 n2 = 10

Tras analizar los datos, puede afirmar el ingeniero que la variabilidad del primer equipo es
mayor que la del segundo?.
Supondremos que las medidas estn distribuidas normalmente.
Formularemos la hiptesis nula H0 : 12 = 22 , es decir, no hay diferencias en la variabilidad. Si
esta hiptesis es cierta, de acuerdo con el corolario 5.2, la variable aleatoria

s21
fexp = (5.37)
s22
sigue una distribucin F con 1 = m 1 = 11 y 2 = n 1 = 9 grados de libertad.
Utilizaremos como criterio para aceptar esta hiptesis que el valor de fexp que obtenemos sea
razonablemente probable, es decir que este comprendida en el intervalo que comprende al 95 %
de las medidas si la hiptesis nula es cierta,

fexp F0,95 (11, 9)


Si esta condicin no se cumple, supondremos valida la hiptesis alternativa H1 : 12 > 22 , que
es la hiptesis que queremos contrastar.

90
5 5. Distribuciones de probabilidad de variables aleatorias continuas

Calculamos fexp
13,5
fexp = = 1,31 (5.38)
10,53
En la tabla del apndice A.4 encontramos F0,95 (11, 9) = 3,10 de modo que fexp < F0,95 (11, 9).
Aceptamos H0 ,las varianzas son iguales. Esto quiere decir que la variabilidad de los dos mtodos
es la misma.

Ejemplo 13. Comparacin de varianzas (III)


La f.e.m. de una pila Cu|Zn fue medida con dos aparatos distintos. Con el primer aparato se
obtuvo una varianza muestral s21 (x) = 0,152 con 11 medidas. Con el segundo aparato el resultado
fue s22 (x) = 0,011 con 6 medidas.
Es consistente este resultado con la hiptesis 12 (x) = 22 (x)?.
Si la hiptesis es cierta, de acuerdo con el corolario 5.2, la variable aleatoria

s21
fexp = (5.39)
s22
sigue una distribucin F con 1 = m 1 = 10 y 2 = n 1 = 5 grados de libertad.
Consideraremos que la hiptesis se cumple si

fexp F0,99 (10, 5)


Calculamos fexp
0,152
fexp = = 13,82 (5.40)
0,011
Por tanto, no podemos aceptar la hiptesis propuesta (hiptesis nula) por que la probabilidad de
obtener ese resultado es muy pequea. Es decir, el valor obtenido corresponde a un intervalo en
el que de ser cierta la hiptesis nula encontraramos el 1 % de los resultados experimentales.

91
5.6 5.6. Ejercicios y problemas

5.6. Ejercicios y problemas


Cuestin 5.1 Dada la funcin de distribucin normal, encuentre el rea bajo la curva que cae

(a) a la izquierda de z = 1.43

(b) a la derecha de z = -0.89

(c) entre z = -2.16 y z=-0.65

(d) a la izquierda de z = -1.39

(e) a la derecha de z = 1.96

(f) entre z = -0.48 y z=1.74

Cuestin 5.2 Dada una distribucin normal estndar, encuentre el valor de k, tal que:

(a) P (Z < k) = 0,0427

(b) P (Z > k) = 0,2946

(c) P (0,93 < Z < k) = 0,7235

Cuestin 5.3 Dada una distribucin normal con = 30 y = 6, encuentre:

(a) el rea de la curva normal a la derecha de x=17

(b) el rea de la curva normal a la izquierda de x=22

(c) el rea de la curva normal entre x=32 y x=41

(d) el valor de x que tiene el 80 % del rea de la curva normal a la izquierda

(e) los dos valores de x que contienen un intervalo central del 75 % del rea de la curva normal

Cuestin 5.4 Si un conjunto de observaciones estn normalmente distribuidas, qu porcentaje de


estas difiere de la media en

(a) ms de 1,3

(b) menos de 0,52

Cuestin 5.5 Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una
poblacin con varianza 2 = 6 tenga una varianza s2

(a) mayor a 9.1

(b) entre 3.462 y 10.745

92
5 5. Distribuciones de probabilidad de variables aleatorias continuas

Cuestin 5.6 Dada una muestra aleatoria de tamao 24 de una distribucin normal, encuentre k de
manera que:

(a) P (2,069 < t < k) = 0,965

(b) P (k < t < 2,807) = 0,095

(c) P (k < t < k) = 0,90

Cuestin 5.7 Para una distribucin 2 encuentre

(a) 20,975 cuando =15

(b) 20,99 cuando =7

(c) 20,95 cuando =24

Cuestin 5.8 Para una distribucin 2 encuentre

(a) 20,95 cuando = 5

(b) 20,95 cuando = 19

(c) 20,99 cuando = 12

Cuestin 5.9 Para una distribucin 2 encuentre 2 de manera que:

(a) P (X 2 < 2p ) = 0,99 cuando = 4

(b) P (X 2 < 2p ) = 0,025 cuando = 19

(c) P (37,652 < X 2 < 2p ) = 0,045 cuando =25

Cuestin 5.10 Encuentre

(a) t0,025 cuando = 14

(b) Encuentre t0,01 cuando = 10

(c) Encuentre t0,995 cuando = 7

Cuestin 5.11 Para una distribucin F encuentre:

(a) F0,95 (1 = 7, 2 = 15)

(b) F0,95 (1 = 15, 2 = 7)

(c) F0,99 (1 = 24, 2 = 19)

93
5.6 5.6. Ejercicios y problemas

Distribucin normal
Ejercicio 5.1 Dada una distribucin normal estndar, encuentre el rea bajo la curva que yace, (a)
a la derecha de z = 1.84 y (b) entre z = -1.97 y z= 0.86.

Ejercicio 5.2 Para una distribucin normal estndar, encuentre el valor de k, tal que (a) P(Z>k) =
0.3015 y (b) P(k<Z<-0.18) = 0.4197.

Ejercicio 5.3 Dada una distribucin normal con x = 50 y s(x) = 10, encuentre la probabilidad de
que X tome un valor entre 45 y 62.

Ejercicio 5.4 Dada una distribucin normal con x = 300 y s(x) = 500, encuentre la probabilidad
de que X tome un valor mayor que 362.

Ejercicio 5.5 Dada una distribucin normal con x = 40 y s(x) = 6, encuentre el valor de x que
tiene (a) 45

Ejercicio 5.6 Cierto tipo de batera de almacenamiento dura, en promedio, 3.0 aos, con una desvia-
cin tpica de 0.5 aos. Suponga que la duracin de las bateras se distribuye normalmente, encuentre
la probabilidad de que una batera dure menos de 2.3 aos.

Ejercicio 5.7 Una empresa elctrica fabrica focos que tienen una duracin media de 800 horas y una
desviacin tpica de 40 horas. Si la duracin de los focos sigue una distribucin normal, encuentre
la probabilidad de que un foco se funda en el intervalo de 778 a 834 horas.

Ejercicio 5.8 En un proceso industrial el dimetro de un cojinete es una parte importante de un


componente. El comprador establece que las especificaciones en el dimetro sean 3.0 0.1 cm. Se
sabe que en el proceso el dimetro de un cojinete tiene una distribucin normal con media 3.0 cm y
una desviacin tpica de 0.005 cm. En promedio, cuntos cojinetes se descartarn?.

Ejercicio 5.9 El 6.3 % de las observaciones de una magnitud que sigue una distribucin normal tiene
un valor superior a 3.287, mientras que el 51.2 % tiene valores mayores que 2.897. Calcule la media
y la varianza de la distribucin.

Ejercicio 5.10 Considere un experimento de medida del pH de una disolucin acuosa caracterizado
por pH = 5.50 y 2 (pH) = 0.06.
Determine el intervalo de valores en el que espera encontrar el 95 % de las medias muestrales de
los experimentos que combinen el resultado de 25 determinaciones del pH de la disolucin indicada.

Distribucin t de student.
Ejercicio 5.11 Considere una variable aleatoria distribuida de acuerdo con una distribucin t de
Student con 9 grados de libertad.
Encuentre el valor de t1 para el cual

a) P (T > t1 ) = 0,05

b) P (T > t1 ) = 0,025

94
5 5. Distribuciones de probabilidad de variables aleatorias continuas

c) P (t1 < T < t2 ) = 0,99

d) P (t1 < T < t2 ) = 0,975

e) P (T t1 ) = 0,90

Ejercicio 5.12 Considere una variable aleatoria distribuida de acuerdo con una distribucin t.
Encuentre el valor de t1 que satisfaga cada una de las siguientes condiciones

a) P (t1 < T < t1 ) = 0,90 y = 25.

b) P (T < t1 ) = 0,025 y = 20.

c) P (T t1 ) = 0,55 y = 16

Ejercicio 5.13 Para una variable U que sigue una distribucin t de Student con = 10 encuentre
los valores de c que cumplen

a) P (U > c) = 0,05.

b) P (c U c) = 0,98.

c) P (U c) = 0,20.

d) P (U c) = 0,90.

Distribucin 2
Ejercicio 5.14 Un fabricante de bateras para automvil garantiza que sus bateras durarn, en
promedio, 3 aos con una desviacin estndar de 1 ao.
Si 5 de estas bateras tienen duraciones de l.9, 2.4, 3.0 ,3.5 y 4.2 aos, puede seguir el fabricante
convencido an de que la duracin de sus bateras tiene una desviacin estndar de 1 ao?

Ejercicio 5.15 Hallar los valores 21 () y 22 () tales que con = 20,el rea bajo la curva sea de
0.95, tales que 21 () < 22 (), y las reas a la derecha de 22 () y a la izquierda de 21 () sean
iguales.
Note que sin estas consideraciones hay infinitos pares de valores 21 () y 22 () que cumplen esta
condicin.

5.6.1. Soluciones a las cuestiones


Cuestion 5.1 a) 0.9236, b) 0.8133 c) 0.2424 d) 0.0823 e) 0.0250 f) 0.6435

Cuestion 5.2 a) -1.72 b) 0.54 c) 1.28

Cuestion 5.3 a) 0.9850 b) 0.0918 c) 0.3371 d) 35.04 e) 23.1 y e) 36.9

Cuestion 5.4 a)19.36 % b) 39.70 %

95
5.6 5.6. Ejercicios y problemas

Cuestion 5.5 a) 0.05 b) 0.94

Cuestion 5.6 a) 2.500 b) 1.319 c) 1.714

Cuestion 5.7 a) 27.488 b) 18.475 c) 36.415

Cuestion 5.8 a) 11.1 b) 30.144 c) 26.217

Cuestion 5.9 a) 13.277 b) 8.91 c) 46.928

Cuestion 5.10 a) -2.145 b) 2.76 c) 3.499

Cuestion 5.11 a) 2.71 b) 3.51 c) 2.92

5.6.2. Soluciones a los ejercicios


Distribucin normal
Ejercicio 5.1 (a)

P (z 1,84) = 0,5 P (0 z 1,84) = 0,5 0,4671 = 0,0329


(b)

P (1,97 z 0,86) = P (1,97 z 0) + P (0 z 0,86)


= P (0 z 1,97) + P (0 z 0,86)
= 0,4756 + 0,3051 = 0,7807

(a) (b)

96
5 5. Distribuciones de probabilidad de variables aleatorias continuas

Ejercicio 5.2 (a)

P (z > k) = 0,3015 P (0 z k) = 0,5 0,3015 = 0,1985

Consultando en la tabla del apndice 1 obtenemos k = 0,52.


(b)

P (k z 0,18) = P (k z 0) P (0,18 z 0)
= P (0 z k) P (0,0 z 0,18)
= P (0 z k) 0,0714

De modo que

0,4197 = P (0 z k) 0,0714
P (0 z k) = 0,4911

Consultando en la tabla del apndice 1 obtenemos k = 2,37.

(c) a (d) b

Ejercicio 5.3
P (45 x 62) = P (z1 z z2 )
donde
x 1 x 45 50
z1 = = = 0,5
(x) 10
x 2 x 62 50
z2 = = = 1,2
(x) 10

97
5.6 5.6. Ejercicios y problemas

de modo que

P (45 x 62) = P (0,5 z 1,2)


= P (0,5 z 0) + P (0,0 z 1,2)
= P (0 z 0,5) + P (0,0 z 1,2)
= 0,1915 + 0,3849
= 0,5764

Ejercicio 5.4
P (x > 362) = P (z > z2 )
donde
x 2 x 362 300
z2 = = = 1,24
(x) 50
de modo que

P (x > 362) = P (z > 1,24)


= 0,5 P (0 z 1,24)
= 0,5 0,3925
= 0,1075

Ejercicio 5.5 (a) De acuerdo con el enunciado del problema

P (z1 < z) = P (z > z1 ) = 0,45

Para obtener el valor de z1 tendremos en cuenta que

P (0 < z < z1 ) = 0,5 P (z > z1 ) = 0,5 0,45 = 0,05

98
5 5. Distribuciones de probabilidad de variables aleatorias continuas

Consultando en la tabla obtenemos P (0 z 0,13) = 0,05, es decir z1 = 0,13


Para obtener x hacemos uso de la definicin de variable reducida
x x
z = = 0,13 x = 40 6 0,13 = 39,22
(x)
(b)
De acuerdo con el enunciado del problema

P (z > z1 ) = 0,14

Para obtener el valor de z1 tendremos en cuenta que

P (0 < z < z1 ) = 0,5 P (z > z1 ) = 0,5 0,14 = 0,36


Consultando en la tabla obtenemos P (0 z 1,08) = 0,36, es decir z1 = 1,08
Para obtener x hacemos uso de la definicin de variable reducida
x x
z = = 0,13 x = 40 6 1,08 = 46,48
(x)

99
5.6 5.6. Ejercicios y problemas

Ejercicio 5.6 El valor de la variable reducida es

x x
z =
(x)
2,3 3,0
=
0,5
= 1,4
De modo que

P (x < 2,3) = P (z < 1,4) = 0,5 P (0 < z < 1,4) = 0,5 P (0 < z < 1,4) = 0,081
Ejercicio 5.7 Queremos calcular

P (778 < x < 834) = P (x < 834) P (x < 778) = P (z < z1 ) P (z < z2 )
Procedemos a calcular las variables reducidas z1 y z2
778 800
z1 = = 0,55
40
834 800
z2 = = 0,85
40
de modo que

P (x < 778) = P (z < 0,55) = 0,5P (0,55 < z < 0,0) = 0,5P (0,0 < z < 0,55) = 0,2912

P (x < 34) = P (z < 0,85) = 0,5 + P (0,0 < z < 0,85) = 0,8023

P (778 < x < 834) = P (x < 834) P (x < 778) = 0,8023 0,2912 = 0,5111

Ejercicio 5.8 Los cojinetes que se descartarn son aquellos que esten fuera del intervalo (2.9,3.1)
cm. Para calcular la fraccin de cojinetes que se descartan calcularemos la fraccin de cojinetes que
esperamos que esten dentro del intervalo, P (2,9 < x < 3,1)
Las variables reducidas vienen dadas por
2,99 3,0
z1 = = 2,0
0,005
3,01 3,0
z2 = = +2,0
0,005

P (2,9 < x < 3,1) = P (2 < z < 2) = 2P (0 < z < 2) = 0,9544


Esperamos que un 4.56 % de los cojinetes no cumplan las especificaciones.

Ejercicio 5.9 = 2,90043 , 2 = 0,0625

100
5 5. Distribuciones de probabilidad de variables aleatorias continuas

Distribucin t de student
Ejercicio 5.11 (a) P (T > t1 ) = 0, 05
Teniendo en cuenta que la probabilidad del suceso seguro es 1 (ver definicin axiomtica de
probabilidad):

P (T t1 ) + P (T > t1 ) =1,00
P (T t1 ) + 0,05 =1,00
P (T t1 ) =0,95

Consultando la tabla de la distribucin t de Student tenemos t1 = t0,95 ( = 9) = 1,83.


(b) Siguiendo el mismo procedimiento que en la seccin a obtenemos t1 = t0,975 ( = 9) = 2,26.
(c) P (t1 < T < t2 ) = 0, 99
Si el intervalo no es smetrico hay infinitos pares de valores de t1 y t2 que cumplen la condicin
prescrita para definir los lmites del intervalo. Sin embargo, slo hay un par de valores de t1 y t2 tales
que si t1 = t2 , P (t1 < T < t2 ) = 0, 99.
Teniendo en cuanta la simetra de la distribucin t de Student, la condicin

P (t2 < T < t2 ) = P (t2 T 0) + P (0 T t2 ) = 0,99

P (T t2 ) + P (T t2 ) = 2,0 P (T t2 ) = 0,01

P (T t2 ) = 0,005
Utilizando los razonamientos de la seccin a tenemos que t2 = t0,995 ( = 9). Consultando la
tabla de la distribucin t de Student tenemos t1 = t2 = t0,995 ( = 9) = 3,25.
(d) P (t1 < T < t2 ) = 0, 975
Siguiendo el mismo razonamiento que en la parte (c) obtenemos t2 = t1 = t0,9875 ( = 9) =
2,73. El valor de la percentila t0,9875 ( = 9) no est incluido en la tabla. Se puede aproximar
utilizando una interpolacin lineal entre los valores de la tabla couespondientes a las percentilas
t0,975 ( = 9) y t0,99 ( = 9).
(e) P (T t1 ) = 0, 90
Teniendo en cuenta la simetra de la distribucin t de Student

P (T t1 ) = P (T t1 ) = 0, 90
de modo que t1 = t0,9 ( = 9) = 1, 38

101
5.6 5.6. Ejercicios y problemas

Ejercicio 5.13 (a) P (U > c) = 0,05


Teniendo en cuenta que la probabilidad del suceso seguro es 1 (ver definicin axiomtica de
probabilidad):

P (U > c) + P (U c) = 1
0,05 + P (U c) = 1
P (U c) = 0,95

Consultando la tabla de la distribucin t de Student tenemos c = t0,95 ( = 9) = 1,83.


(b) P (c U c) = 0,98
Teniendo en cuanta la simetra de la distribucin t de Student, tenemos

P (c U c) = P (c U 0) + P (0 U c) = 0,98

P (U c) + P (U c) = 2, 0xP (U c) = 0,02

P (U c) = 0,01
Finalmente tenemos c = t0,99 ( = 10) = 2,76.
(c)P (U < c) = 0,20
Teniendo en cuanta la simetra de la distribucin t de Student tenemos

P (U < c) = P (U > c) = 0,20


de modo que

P (U < c) = 0,80
Consultando la tabla de la distribucin t de Student tenemos c = t0,80(=10)=0,879 .
(d) P (U c) = 0,20
Teniendo en cuenta la simetra de la distribucin t de Student

P (U c) = P (U c) = 0,90
de modo que c = t0,9 ( = 10) = 1, 37

Distribucin 2
Ejercicio 5.14 La varianza muestral es s2 (x) = 0,815. Suponiendo que las vida media de las bate-
rias sigue una distribucin normal, la variable aleatoria (ecuacin 5.27)

s2 (x)
X 2 = (n 1)
2 (x)
sigue una distribucin 2 ( = n 1).

102
5 5. Distribuciones de probabilidad de variables aleatorias continuas

Sustituyendo obtenemos
4 0,815
X2 = = 3,26
1
Consultando el apndice A.3 tenemos que el intervalo simtrico que contiene el 95 % de las
medidas est comprendido entre 20,025 ( = 4) = 0,484 y 20,975 ( = 4) = 11,143. El resultado
obtenido esta dentro del intervalo y no contradice la hiptesis inicial 2 (x) = 1

5.7. Lecturas recomendadas


Para completar la preparacin de este tema recomendamos la lectura de:

Captulo 2. Estadstica de medidas repetidas. del texto de Miller y Miller[3]. XX

Captulo 1. Magnitudes aleatorias y sus caractersitcas. del texto de Spiridonov y Lopatkin[7].


X
Revisa los contenidos del tema. Adecuado para revisar la teora del tema.

Captulo 4. Distribuciones de Probabilidad especial del libro de Spiegel y cols.[5].


Adecuado para revisar ejercicios. En este tema los autores del libro tambin se tratan otras
distribuciones como la multinomial, hipergeomtrica, Cauchy o gamma. No se han estudiado
porque no son de apliacin frecuente en Qumica. Es mejor obviar las secciones en las que se
explican esas distribuciones pues no son imprescindibles para comprender el tratamiento de las
distribuciones normal, t, 2 o F.
Se recomienda la revisin de los siguientes ejercicios:

Distribucin normal. Ejercicios 4.12 a 4.15


Aproximacin normal a la distribucin binomial. Ejercicios 4.17 a 4.19
La distribucin chi cuadrado. Ejercicios 4.38 a 4.40
La distribucin t de Student. Ejercicios 4.43 y 4.44
La distribucin F . Ejercicios 4.47

En el caso de los ejercicios relacionados con la distribucin normal se ilustra como identificar
los parmetros de la distribucin normal y el uso de las tablas para la evaluacin de probabi-
lidades. El resto de los ejercicios que se recomienda revisar, ilustran como utilizar las tablas
de las percentilas de las distribuciones t, 2 y F . Sirven para revisar como se usan las tablas
estadsticas y adquirir confianza en su manejo.

Captulo 4. Funciones de variables aleatorias. del texto de Walpole y Myers[6]. De este cap-
tulo es til la revisin de las secciones:

6.4 Muestreo aleatorio.


6.5 Algunas estadsticas importantes.

103
5.7 5.7. Lecturas recomendadas

6.8 Distribuciones muestrales de medias.


6.9 La distribucin muestral de (n 1)s2 / 2
6.10 La distribucin t
6.11 La distribucin F

104
6

Intervalos de probabilidad e intervalos de confianza

Contenidos Intervalos de probabilidad Definicin. Clculo del intervalo de proba-


bilidad de la media. Clculo del intervalo de probabilidad de la varianza.
Intervalos de confianza Definicin.
Clculo del intervalo de confianza de la media
Clculo del intervalo de confianza de la diferencia de las medias
Clculo del intervalo de confianza de la varianza para variables
normalmente distribuidas

Objetivos Comprender las diferencias entre intervalo de probabilidad e intervalo de


confianza
Conocer las caractersticas que diferencian un intervalo de probabilidad y
un intervalo de confianza
Calcular intervalos de probabilidad de una magnitud aleatoria.
Calcular intervalos de confianza de la media de una variable gaussiana
Calcular intervalos de confianza de la varianza de una variable gaussiana
Calcular el intervalo de confianza de la diferencia de la media de variables
gaussianas
Comparar datos apareados utilizando el test de la t de Student para datos
apareados

105
6.1. Distribucin de probabilidad del error aleatorio.
Considere un conjunto de medidas x1 , x1 , . . ., xn de una magnitud. En ausencia de error sistem-
tico slo debemos tener en cuenta el error aleatorio. Por tanto, el resultado de una medida, xi , viene
dado por la suma del valor real, x , y el error aleatorio asociado a esa medida i .

x i = x + i (6.1)
Para estimar el valor real, x , necesitamos conocer que funcin de densidad de probabilidad des-
cribe el error aleatorio. Asumiremos que ei sigue una distribucin normal de media = 0 y varianza
2 (). Como i sigue una distribucin normal y x es una constante, los resultados de las medidas xi
tambin siguen una distribucin normal. La media de la distribucin normal de las medidas es x y
su varianza, s2 (x), es igual que la varianza del error aleatorio, 2 (x) = 2 ().
Estas propiedades se demuestran fcilmente utilizando las propiedades de la esperanza matemti-
ca

xi = E [xi ] = E [(x + i )] = x + E [(i )] = x + i = x + 0 = x (6.2)

2 (xi ) = E (xi xi )2 = E ((x + i ) (x + i ))2 = E ((i i )2 = 2 (i )


     
(6.3)

El error aleatorio puede que no este distribuido normalmente. En algunos casos es evidente, por
ejemplo cuando sabemos que nuestros datos siguen una distribucin uniforme, binomial o de Poisson.
En otros casos es necesario comprobar que los datos se ajustan a una distribucin de probabilidad pos-
tulada (gaussiana, log-normal, exponencial, etc). Realizar esta comprobacin es importante cuando el
mtodo utilizado para calcular las estimas poblacionales no es robusto. Un mtodo de clculo de es-
timas no es robusto cuando (i) que los datos utilizados no se ajusten a la distribucin de probabilidad
postulada para desarrollar el mtodo, implica que (ii) las estimas de los parmetros poblacionales que
se obtienen pueden ser errneas.

6.2. Intervalos de probabilidad


6.2.1. Definicin
Sea x una estima del parmetro poblacional (por ejemplo, la media o la varianza).
Se define como el intervalo de probabilidad de la estima x del parmetro con un nivel de
probabilidad p al intervalo de valores de x

xmn = emn 6 x 6 + emax = xmax (6.4)

que cumple

P (xmn 6 x 6 xmax ) = p (6.5)


6 6.Intervalos de probabilidad e intervalos de confianza

Los lmites del intervalo de probabilidad xmin y xmax son valores constantes y se calculan cono-
cidos la forma de la funcin de distribucin (o de densidad de probabilidad) y los parmetros que la
caracterizan (media, varianza).
Se pueden definir infinitos intervalos de probabilidad de una estima x de un parmetro poblacional
con un nivel de probabilidad p.
Nosotros trabajaremos con intervalos de tres tipos:

P (xmn 6 x) = p (6.6)
P (x 6 xmax ) = p (6.7)
P (xmn 6 x 6 xmax ) = p (6.8)

Para este ltimo intervalo imponemos la condicin adicional de que probabilidad de obtener un valor
de x fuera del intervalo de probabilidad sea igual en ambos lados. Es decir

1p
P (xmax 6 x) =
2 (6.9)
1p
P (xmax 6 x) =
2

6.2.2. Intervalos de probabilidad de las medidas


Hemos supuesto que los errores aleatorios siguen una distribucin normal. Por tanto, las medidas
experimentales aisladas tambin siguen una distribucin normal. Como la distribucin normal es
simtrica respecto de la media cuando se calcula el intervalo de probabilidad de una medida frecuente
trabajar con intervalos simtricos alrededor de la media

A0 = D 6 x i 6 + D = A (6.10)

donde D es una constante que se elige dependiendo del valor de nivel probabilidad p del intervalo,

P ( D 6 xi 6 + D) = p (6.11)

D suele fijarse como un mltiplo de , D = k. As la probabilidad asociada al intervalo depende


exclusivamente del valor de k:

k = 1,00 P (A0 6 xi 6 A) = P (1,00 6 z 6 1,00) = 2,0 P (0 6 z 6 1,00) = 0,68


k = 1,96 P (A0 6 xi 6 A) = P (1,96 6 z 6 1,96) = 2,0 P (0 6 z 6 1,96) = 0,95
k = 2,00 P (A0 6 xi 6 A) = P (2,00 6 z 6 2,00) = 2,0 P (0 6 z 6 2,00) = 0,955
k = 3,00 P (A0 6 xi 6 A) = P (3,00 6 z 6 3,00) = 2,0 P (0 6 z 6 3,00) = 0,997

107
6.2 6.2. Intervalos de probabilidad

6.2.3. Intervalos de probabilidad de las medias


El intervalo de probabilidad se calcula del mismo modo que el intervalo de probabilidad de los
datos pero teniendo que para n medidas (ver seccin 5.2.1):

(
x) = (x) (6.12)

2 (x)
2 (
x) = (6.13)
n

Ejemplo 1. Clculo del intervalo de probabilidad de un conjunto de medidas


En una prctica de laboratorio se midi el pH de una disolucin. El anlisis del conjunto de los
resultados condujo a los valores pH = 5,00 y 2 (pH) = 0,04.
Determine el intervalo de valores que comprende el 95 % de las medidas del pH.
Para una distribucin normal estandarizada (ver seccin 5.2 y apndice 1) tenemos

P (1,96 6 z 6 1,96) = 2 P (0 6 z 6 1,96) = 0,95


donde
x x
z=
(x)
De donde sigue que los lmites del intervalo que queremos calcular cumplen
(
n 5,0
pH pH 1,96 = pHm0,2 pHmn = 4,61
z= = 1,96 pHmax 5,0
(pH) +1,96 = 0,2
pHmn = 5,39
El intervalo de pH donde se encuentra el 95 % de las medidas es [4.80,5.20].

6.2.4. Intervalos de probabilidad de las varianzas


La varianza muestral s2 (x) sigue una distribucin 2 (ver seccin 5.4.1). Esta distribucin es
asimtrica, y los valores de las cuantilas que necesitamos para calcular los lmites del intervalo de
probabilidad, A0 y A, dependen del nivel de probabilidad elegido, p y del nmero de medidas, n.
Si la muestra comprende n medidas y queremos calcular el intervalo de probabilidad con un nivel
de probabilidad p, el intervalo de probabilidad de s2 (x) viene dado por

2 (x) 2 (x)
21p () 6 s2 (x) 6 21 p () (6.14)
(n 1) 2 (n 1) 2

108
6 6.Intervalos de probabilidad e intervalos de confianza

Figura 6.1: Si la magnitud X est normalmente distribuida, y D = 1,96, la probabilidad de que el


resultado de una medida x se encuentre entre los valores A0 y A es PN (A0 x A) = 0,95

6.3. Intervalos de confianza


6.3.1. Definicin
Sea x una estima del parmetro poblacional .
Se define como el intervalo de confianza del parmetro x con un nivel de confianza 1 como
el intervalo de valores de x

x0mn = x emn 6 6 x + emax = x0max

que cumple

P (x0mn 6 6 x0max ) = p = 1

1 es el nivel o grado de confianza del intervalo [x1, x2]. El nivel de confianza es una medida
de la probabilidad de que el parmetro x est dentro del intervalo [x1, x2].
es el grado de significacin y da idea de la probabilidad de que el parmetro x est fuera del
intervalo estimado.
Una diferencia importante entre los intervalos de probabilidad y los intervalos de confianza es
la naturaleza de los extremos. En un intervalo de probabilidad con un nivel de probabilidad p los
extremos del intervalo xmin y xmax son constantes, no cambian al repetir el experimento. En un
intervalo de confianza con un nivel de confianza 1 = p, los extremos del intervalo son x0min y
x0max son nmeros aleatorios. Esto se debe al hecho de que para calcularlos utilizamos la estima de

109
6.3 6.3. Intervalos de confianza

, x, que es una variable aleatoria. Por tanto, los extremos dependen de los datos empleados para
calcular x y pueden ser distintos en distintos experimentos.
Consideremos un experimento en que 2 (x) es conocida con gran precisin. Se realiza una medida
y se obtiene un valor xi . El valor de xi puede no coincidir con pero est incluido dentro del intervalo
de probabilidad p dado por
que corresponde al intervalo de valores en el que esperamos obtener xi con una probabilidad p,
conocidos los valores de x y 2 (x). Esto es, xi est comprendido entre A0 y A en la figura 6.2.
Si no conocemos x slo podemos intentar estimar el intervalo en que esperamos que encontrar a
x (constante) conocido el valor de su estima xi (variable aleatoria), es decir

k 6 xi 6 + k (6.15)
Esto corresponde a que M est comprendida entre B 0 y B en la figura 6.2

xi k 6 6 xi + k (6.16)

Figura 6.2: Comparacin de (a) intervalo de probabilidad, x k xi x + k, y (b) el intervalo


de confianza xi k x xi + k. Basado en la figura 6.2 del texto de J. Mandel reseado en la
bibliografa.

Aunque las dos expresiones anteriores son equivalentes algebraicamente, tienen distinto signifi-
cado. La primera (6.15) expresa el hecho de que la variable aleatoria x est comprendida entre las
constantes x k y x + k (un intervalo de probabilidad). La segunda (6.16) implica que espera-
mos que la constante que se encuentre en un intervalo definido por dos variables aleatorias xi k y
xi + k (un intervalo de confianza). La interpretacin terica de los intervalos de confianza es debida
a Neyman y Pearson: el intervalo de confianza expresa la probabilidad de que x este comprendida
en el intervalo aleatorio que se extiende de xi k a xi k (en el intervalo B B de la figura 6.2).
Si cada experimento consta de n medidas, la estima de x es la media muestral, . El intervalo de
probabilidad para la media muestral es

k 6 x 6 + k (6.17)
n n

110
6 6.Intervalos de probabilidad e intervalos de confianza

mientras que el intervalos de confianza de la media poblacional es


x k 6 6 x + k (6.18)
n n

La figura 6.3 ilustra el concepto del concepto de intervalo de confianza. En las figura se representan
los resultados de una serie de medidas con sus respectivos intervalos de confianza. Cada medida hace
referencia a una estimacin independiente del parmetro x . Debido a la naturaleza aleatoria de los
errores, las estimas fluctan alrededor del valor x . Las barras de error representan los intervalos de
confianza de las estimas de x basadas en la medida xi o en la media muestral de n medidas, x.
Las barras de error de cada medida equivalen a los intervalos deconfianza BB de la figura 6.2. El
lmite inferior de la barra de error representa
el valor x k (x)/ n, mientras que el lmite superior
representa el valor de a x +k (x)/ n. En el diagrama suponemos que todas las estimas se realizaron
utilizando nmedidas, en consecuencia la longitud de los intervalos de confianza es constante e igual
a 2k (x)/ n .
Observe que en la figura 6.3 no todos los intervalos de confianza cortan la lnea discontinua (que
corresponde al valor del parmetro x ). El nivel de confianza asociado de cada intervalo puede in-
terpretarse como la frecuencia con la que esperamos que los intervalos obtenidos experimentalmente
incluyan el valor real de la magnitud que estemos estimando (x en este ejemplo) cuando dibujramos
una grfica como la de la figura 6.3 y el nmero de medidas fuera muy grande.

Figura 6.3: Intervalos de confianza de la media cuando la varianza 2 (x) es conocida. La longitud de
los segmentos es constante pero la posicin de sus puntos medios es una variable aleatoria. Note que
la longitud de los segmentos es proporcional al nmero de medidas utilizadas para calcular x. Basado
en la figura 6.3 del texto de J. Mandel reseado en la bibliografa.

111
6.4 6.3. Intervalos de confianza

Si tanto la media x como la varianza 2 (x) son desconocidas, utilizaremos las estimas muestrales
de x y 2 (x), x y s2 (x) para calcular el intervalo de confianza de m. Sabemos que

x x
t= (6.19)
s(x)/ n
es una variable aleatoria que sigue una distribucin una distribucin t de Student con = n 1
grados de libertad (ver seccin 5.3.1 ). Con esta expresin podemos obtener un intervalo centrado en
la media muestral (intervalo de confianza)

s(x)
x x | 6 tp
| (6.20)
n

s(x) s(x)
x tp 6 x 6 x + tp (6.21)
n n
donde el valor de tp depende del nmero de medidas y del nivel de confianza (p = 1 ).
Adems, puesto que s(x) es una variable aleatoria, la longitud del intervalo de confianza varia
de muestra a muestra. La figura 6.4 ilustra el concepto del concepto de intervalo de confianza en este
caso. En las figura se representan los resultados de una serie de medidas con sus respectivos intervalos
de confianza. Cada medida hace referencia a una estimacin independiente del parmetro x . Debido
a la naturaleza aleatoria de los errores, las estimas fluctan alrededor del valor x . Adems como los
extremos del intervalo se calculan utilizando la varianza muestral, s2 (x), la longitud de los intervalos
de confianza es una variable aleatoria.

Figura 6.4: Intervalos de confianza de la media cuando la varianza 2 (x) se desconoce. Como s(x)
varia de experimento a experimento, tanto la longitud de los intervalos como sus puntos medios son
variables aleatorias. Adems, la longitud de los segmentos tambin es proporcional al nmero de
medidas utilizadas para calcular x. Basado en la figura 6.3 del texto de J. Mandel reseado en la
bibliografa.

112
6 6.Intervalos de probabilidad e intervalos de confianza

6.4. Calculo de intervalos de confianza para la media


6.4.1. Datos distribuidos normalmente con varianza 2 (x) conocida
Suponga que dispone de n observaciones x1 , x2 , . . ., xn distribuidos de acuerdo con una distribu-
cin normal de media x y varianza 2 (x), PN (x; x , 2 (x)) y de la que no conocemos x .
Puesto que la media muestral sigue una distribucin normal, PN (x; x , (x)/n el intervalo de
confianza de x con un nivel de confianza 1 es

(x) (x)
x k1 2 6 x 6 x + k1 2 (6.22)
n n

 
(x) (x)
x k1 2 , x + k1 2 (6.23)
n n

(x)
x k1 2 (6.24)
n

donde k1/2 toma un valor tal que se cumple

   
(x) (x) x x
P x k1 2 6 x 6 x + k1 2 =P k1 2 6 6 k1 2 =1
n n (x)/ n
(6.25)

6.4.2. Datos distribuidos normalmente con varianza finita y con n grande


Suponga que dispone de n observaciones x1 , x2 , . . ., xn que siguen la misma distribucin de
probabilidad con media x y varianza 2 (x) finita, ambas desconocidas pero con un valor de n grande
(n 50). De acuerdo con el teorema del lmite central (ver 5.2.1), x, sigue una distribucin normal
de media x y varianza 2 (x).
As, la variable aleatoria

x
z= n (6.26)
(x)
sigue una distribucin normal de media z = 0 y varianza varianza 2 (z) = 1, PN (z; 0, 1).
Para valores grandes de n podemos hacer la aproximacin

2 (x)
= s2 (x) (6.27)
De modo que el intervalo de confianza de la media con un nivel 1 viene dado por

(x) (x)
x k1 2 6 x 6 x + k1 2 (6.28)
n n

113
6.4 6.4. Calculo de intervalos de confianza para la media

(x)
x k1 2 (6.29)
n
donde k1/2 toma un valor tal que se cumple

   
(x) (x) x x
P x k1 2 6 x 6 x + k1 2 =P k1 2 6 6 k1 2 =1
n n (x)/ n
(6.30)
Cuando es n lo suficientemente grande?. El valor de n depende de la funcin de distribucin que
caracteriza al conjunto de datos estudiado. El tema va ms all de los contenidos de este curso. Como
referencia podemos utilizar n 50.

Ejemplo 2. Clculo del intervalo de confianza de la media (I)


Para una variable aleatoria x distribuida normalmente con varianza 2 (x) = 1 se obtuvieron los
siguientes datos : +0.250, +1.620, + 0.014, -0.366, + 0.756, + 0.608, -2.150, +1.162.
Determine el intervalo de confianza del 95 % de la media poblacional
El intervalo de confianza viene dado por las ecuaciones 6.22, 6.23 6.24. Por comodidad utili-
zaremos la ecuacin 6.24

(x)
x k1 2
n

Calculamos x = 0,205 y ( x) = (x)/ n = 1/3
Puesto que el nivel de confianza es del 95 %,
x x
   

P k 6 (x) n 6 k = 2P 0 6 (x)
n 6 k = 0,95

x
 

P 06 (x)
n 6 k = 0,475 k = 1,96
Sustituyendo en la ecuacin 6.24 obtenemos
1
0,205 1,96 = 0,653
3

6.4.3. Datos distribuidos normalmente con varianza 2 (x) desconocida


Suponga que dispone de n observaciones x1 , x2 , . . ., xn distribuidos de acuerdo con una distri-
bucin normal de media x y varianza 2 (x), PN (x; x , 2 (x)), pero que desconoce la media y la
varianza.
Para obtener el intervalo de confianza haremos uso de que la variable aleatoria (ver 5.3.1)
x x
t= (6.31)
s(x)/ n

114
6 6.Intervalos de probabilidad e intervalos de confianza

que est distribuida de acuerdo con una distribucin t de Student con = n 1 grados de libertad.
Recuerde que la distribucin t de Student es simtrica respecto a t = 0.
Por tanto

s(x) s(x)
x t1 2 ( = n 1) 6 x 6 x + t1 2 ( = n 1) (6.32)
n n

 
s(x) s(x)
x t
1 ( = n 1) , x + t1 2 ( = n 1) (6.33)
2
n n

s(x)
x t1 2 ( = n 1) (6.34)
n

donde tp (n = 1 n) corresponde al valor de t tal que


P t1 2 ( = n 1) 6 t( = n 1) = 1 (6.35)

s(x) x x
t1 2 ( = n 1) 6 6 t1 2 ( = n 1) (6.36)
n s(x)/ n

Ejemplo 3. Clculo del intervalo de confianza de la media (II)


Considere los de resultados de un experimento en los que se determin la densidad de un pol-
mero de alto peso molecular: = 1,25510 g.cm3 , s() = 3,7 104 g.cm3 y n = 5.
Determine el intervalo de confianza del 95 % de la media poblacional
El intervalo de confianza viene dado

s(x)
x t1 2 ( = n 1) (6.37)
n

Puesto que el nivel de confianza es del 95 %,

3,7 104 3,7 104


=1,25510 t0,975 ( = 4) = 1,25510 2,776
5 5
=1,25510 0,0005 g.cm3

115
6.5 6.5. Calculo de intervalos de confianza para la varianza

Ejemplo 4. Clculo del intervalo de confianza de la media (III)


Diez anlisis de la concentracin de albmina dieron una media de 20.92 g/l y una desviacin
tpica de 0.45 g/l.
Calcule el intervalo de confianza del 95
El intervalo de confianza viene dado

s(x)
x t1 2 ( = n 1) (6.38)
n

Puesto que el nivel de confianza es del 95 %,

0,45 0,45
c =20,92 t0,975 ( = 8) = 20,92 2,31
9 3
3
=20,92 035 g.cm

6.4.4. Datos que siguen una distribucin desconocida con varianza finita y con
n pequea
En este caso no podemos decir nada. Para poder aplicar el teorema del lmite central (ver necesi-
tamos ms medidas.

6.5. Calculo de intervalos de confianza para la varianza


Considere que dispone de un conjuntos de n observaciones independientes x1 , x2 , . . ., xn que
siguen una distribucin normal PN (x; x , 2 (x)) de la que se desconoce x y 2 (x).
Se puede demostrar que la variable aleatoria
n
2
X (xi x)2 s2 (x)
X = = (n 1) (6.39)
i=1
2 (x) 2 (x)

sigue una distribucin 2 con = n 1 grados de libertad.


Por tanto,

s2 (x)
 
2 2
P /2 () 6 (n 1) 2 6 1/2 () = 1 (6.40)
(x)

donde 2/2 y 21/2 son las cuantilas de /2 y 1 /2 de las distribucin 2 (). Reordenando esta
expresin se obtiene
!
(n 1) s2 (x) (n 1) s 2
(x)
P 2
6 2 (x) 6 =1 (6.41)
1/2 () 2/2 ()

116
6 6.Intervalos de probabilidad e intervalos de confianza

y el intervalo de confianza con un nivel de confianza a viene dado por


!
(n 1) s2 (x) (n 1) s2 (x)
, (6.42)
21/2 () 2/2 ()

Note que el intervalo no es simtrico respecto de s2 (x).

Ejemplo 5. Clculo del intervalo de confianza de la varianza


Considere de nuevo el experimento de la determinacin de la densidad de un polmero. En una
tanda de experimentos se obtuvo s2 () = 14,0 108 g2 .l2 , n = 5.
Determine el intervalo de confianza de 2 () con = 0,90.
El intervalo de confianza viende dado por
!
(n 1) s2 (x) (n 1) s2 (x)
,
21/2 () 2/2 ()
Tenemos:

(n 1) s2 = 5,6 107
Consultando el apndice 3, obtenemos 20,05 ( = 4) = 0,711 y 20,95 ( = 4) = 9,49.
Sustituyendo

5,67 107 5,67 107


 
, = (0,60, 7,97) 107
9,49 0,711

6.6. Clculo de intervalos de confianza para la diferencia de las


medias
Considere que dispone de un conjuntos de observaciones independientes x1 , x2 , . . ., xn1 e y1 , y2 ,
. . ., yn2 con n1 y n2 medidas cada uno.
Sean 1 y 2 las medias poblacionales de x e y respectivamente . En esta seccin explicaremos
como calcular el intervalo de confianza de 1 2 .

117
6.6 6.6. Clculo de intervalos de confianza para la diferencia de las medias

6.6.1. Datos distribuidos normalmente con varianzas 12 (x) y 22 (y) conocidas


La suma de dos variables aleatorias gaussianas sigue tambin una distribucin gaussiana (ver
5.2.1).
Si x sigue una distribucin PN (x; x , 12 (x)) e y una distribucin PN (x; y , 22 (y)). La variable
aleatoria d = x y sigue una distribucin gaussiana PN (d; 1 2 , 12 (x)/n1 + 2 2(y)/n2).
Por tanto la variable d, definida como

x y) (1 2 )
(
d=  2 1/2 (6.43)
1 22
n1
+ n2

sigue una distribucin PN (d; 0, 1) y el intervalo de confianza viene dado por

1/2
12 22

x y) z(1 )
( + (6.44)
2 n1 n2

6.6.2. Datos distribuidos normalmente con varianzas 12 (x) y 22 (y) desconoci-


das pero iguales
Considere dos variables aleatorias tales que x sigue una distribucin PN (x; x , 12 (x)) e y una
distribucin PN (x; y , 22 (y)). La variable aleatoria d = x y sigue una distribucin gaussiana
PN (d; 1 2 , 12 (x)/n1 + 2 2(y)/n2).
Si las varianzas no son conocidas pero podemos suponer que 12 (x) = 2 2(y), se puede suponer
que la variable aleatoria t

(x y) (1 2 )
t=  1/2 (6.45)
s (x y) n11 + n12

sigue una distribucin t de Student con = n1 + n2 2 grados de libertad.


La estima de 2 (x y), s2 (x y) se calcula utilizando la ecuacin

(x x)2 + (y y)2 (n1 1) s21 + (n2 1) s22


P P
s2 (x y) = = (6.46)
n1 + n2 2 n1 + n2 2

El intervalo de confianza viene dado por

 1/2
1 1
x y) t1 (n1 + n2 2) s (x y)
( + (6.47)
2 n1 n2

118
6 6.Intervalos de probabilidad e intervalos de confianza

Ejemplo 6. Clculo del intervalo de confianza de la diferencia de las medias


En la comparacin de dos mtodos de preparacin de polmeros, se obtuvieron los siguientes
resultados para la densidad media de las disoluciones de polmero preparadas en cada mtodo.

Mtodo 1.bar = 1,21510 g.cm - 3 s2 () = 1,4 107 g.cm - 3 n1 = 5


Mtodo 1.bar = 1,21650 g.cm - 3 s2 () = 6,5 107 g.cm - 3 n2 = 4
Determine el intervalo de confianza del 90 % de la diferencia de las medias. Hay una diferencia
significativa en la densidad del polmero generado en estos mtodos?.
El intervalo de confianza viende dado por
 1/2
1 1
x y) t1 (n1 + n2 2) s (x y)
( +
2 n1 n2

donde

x y) = 1,4 103
(
(n1 1) s21 + (n2 1) s22 (4 14 + 3 60,5) 108
2
s (x y) = = = 33,9 108
n1 + n2 2 (5 + 4 2)
4 (6.48)
s (x y) = 5,82 10
 1/2
1 1
s (x y) + = 2,91 104 t0,95 ( = 7) = 1,895
n1 n2

Sustituyendo se obtiene el intervalo de confianza de la diferencia de las medias:

12 = (1,4 0,5) 103 g.l1 (6.49)


Note que el intervalo de confianza no incluye el cero lo que indica que con un nivel de confianza
del 90 % las densidades de los polmeros producidos por ambos mtodos son diferentes.

6.6.3. Datos que siguen cualquier distribucin con varianza finita y con n1 y
n2 grandes
De acuerdo con el teorema del lmite central (ver 5.2.1) para valores grandes de n1 y n2 , las
variables aleatorias

x x y y
zX = n1 zY = n2 (6.50)
(x) (y)

siguen distribuciones normales de media 0 y varianza 1.0.

119
6.7 6.7. Anlisis de datos emparejados

Para valores grandes de n podemos hacer la aproximacin

2 (x)
= s2 (x)
(6.51)
2 (y)
= s2 (y)
de modo que el intervalo de confianza 1 2 de la media con un nivel de confianza 1 es
1/2
s21 s2

x y) z(1 )
( + 2 (6.52)
2 n1 n2

6.6.4. Datos distribuidos normalmente con varianzas 12 (x) y 22 (y) desconoci-


das y distintas
Consideremos las variables x e y con distribuciones PN (x; 1 , 12 (x)) y PN (x; 1 , 12 (x)), de las
que no conocemos sus varianzas pero sospechamos que 12 (x) 6= 22 (y).
Para estimar el intervalo de confianza de la media utilizaremos el estadstico

x y) (1 2 )
(
t=  2 1/2 (6.53)
s1 s22
n1
+ n2

que sigue una distribucin t de Student con grados de libertad que se calculan redondeando el valor
obtenido de la expresin
 2
s21 s22
n1
+ n2
= 
s41 s42 (6.54)
n21 (n1 1)
+ n22 (n2 1)

1 = n1 1 2 = n2 1
a un nmero entero.
Finalmente, el intervalo de confianza viene dado por
1/2
s21 s2

x y) t1 ()
( + 2 (6.55)
2 n1 n2

6.7. Anlisis de datos emparejados


A menudo se compararan dos mtodos de anlisis estudiando muestras de ensayo que contienen
sustancialmente diferentes cantidades de analito. Por ejemplo, suponga que se desea comparar dos
mtodos para la determinacin de la concentracin de paracetamol en pastillas. Con este fin, se ana-
lizan diez pastillas de diez lotes diferentes para ver si difieren los resultados obtenidos por los dos
mtodos. Como siempre existe variacin entre las medidas debida al error aleatorio de la medida.
Adems, las diferencias entre las tabletas y entre los mtodos pueden contribuir tambin a la varia-
cin entre las medidas. Esto ltimo es lo que interesa en este ejemplo: se desea saber si los mtodos
producen resultados significativamente diferentes. Estudiar la diferencia entre las mdias de los resul-
tados obtenidos con cada mtodo no es apropiado en este caso porque no separa la variacin debida

120
6 6.Intervalos de probabilidad e intervalos de confianza

al mtodo de la que resulta de la variacin entre las pastillas: se dice que los dos efectos se con-
funden. Esta dificultad se soslaya observando la diferencia, d, entre cada par de resultados dados
por los dos mtodos. Si no existen diferencias entre los dos mtodos, entonces estas diferencias se
obtienen de una poblacin con media d = 0. Para probar la hiptesis nula, se prueba si d difiere
significativamente de cero utilizando el estadstico t.
Para contrastar si n resultados emparejados se extraen de la misma poblacin, es decir, H0 : d =
0, se calcula el estadstico t:

d
t= (6.56)
s(d)/ n

donde d y S(d) son la media y la desviacin estndar, respectivamente, de d, la diferencia entre los
valores que forman cada par de medidas. El nmero de grados de libertad de t es = n 1.
Los contrastes por parejas descritos no requieren que las precisiones de los dos mtodos sean igua-
les. Suponen que las dife rencias, d, estn distribuidas normalmente. En efecto, esto exige que cada
conjunto de medidas se distribuya normalmente y que la precisin y sesgo (si acaso) de cada mtodo
sean constantes en el intervalo de valores en que se realizaron las medidas. Los datos pueden constar
de medidas individuales, como en o de medias de medidas repetidas. Sin embargo, es necesario que
se realice el mismo nmero de medidas sobre cada muestra por el primer mtodo y anlogamente por
el segundo mtodo: es decir, n medidas de cada muestra por el mtodo 1 y por el mtodo 2, donde
m y n deben ser iguales. Hay diferentes circunstancias por las cuales puede ser necesario o deseable
disear un experimento, de manera que cada muestra sea analizada por cada uno de los dos mtodos,
proporcionando resultados que estn emparejados de forma natural.
Algunos ejemplos son:

1. La cantidad de muestra disponible a examen es suficiente para slo una determinacin por cada
mtodo.

2. Las muestras a examen pueden presentarse durante un extenso perodo de tiempo por lo que es
necesario eliminar los efectos de las variaciones en condiciones ambientales como temperatura,
presin, etc.

3. Los mtodos se van a comparar utilizando una amplia variedad de muestras de diferente proce-
dencia y posiblemente con concentraciones muy distintas

Ejemplo 7. Contraste de datos emparejados


Los datos de la tabla recogen los resultados de medias de la concentracin de paracetamol (en
mg) para un lote de 10 pastillas

Lote 1 2 3 4 5 6 7 8 9 10
UV 84.63 84.38 84.08 84.41 83.82 83.55 83.92 83.69 84.06 84.03
NIR 83.15 83.72 83.84 84.20 83.92 84.16 84.02 83.60 84.13 84.24

Hay una diferencia significativa entre los resultados obtenidos por los dos mtodos?

121
6.7 6.7. Anlisis de datos emparejados

Las diferencias entre los pares de vlores (restando el segundo al primero son):

Lote 1 2 3 4 5 6 7 8 9 10
UV 84.63 84.38 84.08 84.41 83.82 83.55 83.92 83.69 84.06 84.03
NIR 83.15 83.72 83.84 84.20 83.92 84.16 84.02 83.60 84.13 84.24
d +1.48 +0.66 +0.24 +0.21 -0.10 -0.61 -0.10 +0.09 -0.07 -0.21

Estos valores tienen una media d = 0,159 y desviacin tpica s(d) = 0,570.
Si H0 : d = 0,de acuerdo con la ecuacin 6.56

d
texp = < t0,95 ( = 9)
s(d)/ n

texp = 0,88 que es menor que el valor crtico t0,95 ( = 9) = 2,26. Es decir, ambos mtodos no
proporcionan resultados significativamente diferentes para la concentracin de paracetamol.

122
6 6.Intervalos de probabilidad e intervalos de confianza

6.8. Ejercicios y problemas


Cuestin 6.1 Indique la mejor respuesta
La variable aleatoria x esta distribuida de acuerdo con una distribucin

(a) normal

(b) t de Student con = n grados de libertad

(c) t de Student con = n 1 grados de libertad

(d) 2 con = n 1 grados de libertad

(e) F con 1 = n 1 y 2 = n grados de libertad

(f) Ninguna de las anteriores

Cuestin 6.2 Indique la mejor respuesta



x x )/(s(x)/ n) esta distribuida de acuerdo con una distribucin
La variable aleatoria y = (

(a) normal

(b) t de Student con = n grados de libertad

(c) t de Student con = n 1 grados de libertad

(d) 2 con = n 1 grados de libertad

(e) F con 1 = n 1 y 2 = n grados de libertad

(f) Ninguna de las anteriores

Cuestin 6.3 Indique la mejor respuesta


La variable aleatoria s2 (x) de datos que siguen una distribucin normal esta distribuida de acuer-
do con una distribucin

(a) normal

(b) t de Student con = n grados de libertad

(c) t de Student con = n 1 grados de libertad

(d) 2 con = n 1 grados de libertad

(e) F con 1 = n 1 y 2 = n grados de libertad

(f) Ninguna de las anteriores

123
6.8 6.8. Ejercicios y problemas

Cuestin 6.4 Verdadero o falso. Jusitfique la respuesta.


Sea x una estima del parmetro poblacional .
El intervalo de probabilidad de la estima x del parmetro con un nivel de probabilidad p es el
intervalo de valores de x que cumple
Se define como el intervalo de probabilidad de la estima x del parmetro con un nivel de
probabilidad p al intervalo de valores de x

xmn = emn 6 x 6 + emax = xmax (6.57)

que cumple

P (xmn 6 x 6 xmax ) = p (6.58)

Hay infinitos intervalos de probabilidad que cumple esta condicin

Cuestin 6.5 Indique aquellas afirmaciones que sean correctas


Un intervalo de probabilidad simtrico

(a) slo existe para datos que siguen distribuciones de probabilidad simtricos

(b) est centrado alrededor de la media

(c) para x est centrado en x

(d) para x est centrado en x

(e) para s2 (x) no est centrado en 2 (x)


1p 1p
(f) cumple que P (xmax 6 x) = 2
y P (xmax 6 x) = 2

Cuestin 6.6 Indique la mejor respuesta


Los lmites x1 y x2 del intervalo de probabilidad simtrico

xmn = emn 6 x 6 + emax = xmax (6.59)


con nivel de probabilidad p son

(a) constantes

(b) nmeros aleatorios

(c) Ninguna de las anteriores. Justifique la respuesta

Cuestin 6.7 Defina intervalo de confianza.

Cuestin 6.8 Cuando se trabaja con intervalos de confianza, qu indicamos con el nivel de con-
fianza del intervalo?.

124
6 6.Intervalos de probabilidad e intervalos de confianza

Cuestin 6.9 Indique aquellas afirmaciones que sean correctas


Los intervalos de confianza con nivel de confianza 1 para la media pueden calcularse como
(x)
(a) x z1 2
n

(x)
(b) x z1 2
n

s(x)
(c) x t1 2 ( = n 1)
n

s(x)
(d) x t1 2 ( = n 1)
n

Problema 6.1 Para investigar la reproducibilidad de un mtodo para la determinacin de selenio en


alimentos, se realizaron nueve medidas sobre un lote de arroz tostado, con los siguientes resultados:
0,07 0,07 0,08 0,07 0,07 0,08 0,08 0,09 0,08 g.g1
Calcular la media, desviacin estndar y desviacin estndar relativa de estos resultados.
La desviacin estndar relativa se define como 100 s(x)/
x.

Problema 6.2 Siete medidas del pH de una solucin reguladora proporcionaron los siguientes resul-
tados:
5,12 5,20 5,15 5,17 5,16 5,19 5,15
Calcular los lmites de confianza para el verdadero pH al nivel de confianza del (i) 95
(Suponer que no existen errores sistemticos.)

Problema 6.3 Diez anlisis repetidos de la concentracin de mercurio en una muestra de condensa-
do de gas comercial proporcionaron los siguientes resultados:
23,3 22,5 21,9 21,5 19,9 21,3 21,7 23,8 22,6 24,7 ng.ml1
Calcular la media, desviacin estndar, desviacin estndar relativa de estos resultados y lmites de
confianza de la media al 99

Problema 6.4 Seis anlisis repetidos de otra muestra proporcionaron los siguientes valores:
13,8 14,0 13,2 11,9 12,0 12,1 ng.ml1
Calcular la media, desviacin estndar, desviacin estndar relativa de estos resultados y lmites de
confianza de la media al 99

Problema 6.5 Se midi la concentracin de plomo en el fluido sanguneo para una muestra de 50
nios de un colegio prximo a una calle con mucho trfico. La media muestral fue 10.12 ng.ml1 y la
desviacin estndar fue 0.64 ng.ml1 .
Calcular el intervalo de confianza al 95 % para la concentracin media de plomo de todos los
nios de la escuela.

Problema 6.6 Considere los datos del problema 6.5.


Qu tamao debera tener la muestra para reducir la longitud del intervalo de confianza a 0.2
ng.ml1 (es decir: 0,1 ng.ml1 )?

125
6.8 6.8. Ejercicios y problemas

Problema 6.7 Para la evaluacin de un mtodo para la determinacin de fluoreno en agua de mar,
se adicion a una muestra sinttica de agua de mar 50 ng.ml1 de fluoreno.
Diez muestras repetidas de la concentracin de fluoreno en la muestra tuvieron una media de 49.5
ng.ml1 con una desviacin estndar de 1.5 ng.ml1 .
Calcule los lmites de confianza de la media al 95 %.
Est el valor adicionado de 50 ng.ml1 dentro de los lmites de confianza al 95 % ?

Problema 6.8 Se utiliz una disolucin 0.1 M de cido para valorar 10 ml de una solucin de lcali
0.1 M , registrndose los siguientes volmenes de cido:
9,88 10,18 10,23 10,39 10,21 ml
Calcule los lmites de confianza de la media al 95 % y utilcelos para decidir si existe alguna
evidencia de error sistemtico.

Problema 6.9 En un mtodo nuevo para determinar selenourea en agua, se obtuvieron los valores
para muesstras de agua de grifo adicionadas con 50 ng.ml1 de selenourea

50.4 50.7 49.1 49.0 51.1

Hay alguna evidencia de error sistemtico?

Problema 6.10 En una comparacin de dos mtodos para la determinacin de cromo en muestras
de hierba de centeno se obtuvieron los siguientes resultados (mg.Kg1 )

Mtodo 1 Media = 1.48 d.e. = 0.28


Mtodo 2 Media = 2.33 d.e. = 0.31

Para cada mtodo se realizaron 5 determinaciones. Estos dos mtodos proporcionan resultados
cuyas medias difieren significativamente?

Problema 6.11 En una serie de experimentos para la determinacin de estao en productos ali-
menticios las muestras fueron llevadas a ebullicin con HCl a reflujo para diferentes tiempos. Los
resultados fueron:

Tiempo de reflujo (min) Estao encontrado


30 55 57 59 56 56 59
75 57 55 58 59 59 59

Es significativa la diferencia entre las cantidades encontradas obtenidas para los dos de ebulli-
cin?

Problema 6.12 Los datos de la siguiente tabla proporcionan la concentracin de tiol (mM) en el
lisado sanguneo de dos grupos de voluntarios siendo el primer grupo "normal el segundo sufriendo
2

artritis reumatoide
Es significativa la diferencia entre las cantidades de tiol en sangre encontradas para los distintos
grupos de voluntarios?.

126
6 6.Intervalos de probabilidad e intervalos de confianza

Normal 1.84 1.92 1.94 1.92 1.85 1.91 2.07


Reumatoide 2.81 4.06 3.62 3.27 3.27 3.76

Problema 6.13 Para evaluar un mtodo espectrofotomtrico para determinar titanio, se aplic el
mtodo a muestras de aleaciones conteniendo diferentes cantidades certificadas de titanio. Los resul-
tados ( % Ti) se muestran a continuacin.

Muestra Valor celtificado Media Desviacin estndar


1 0.496 0.482 0.0257
2 0.995 1.009 0.0248
3 1.493 1.505 0.0287
4 1.990 2.002 0.0212

Para cada aleacin se realizaron 8 determinaciones repetidas.


Para cada aleacin, contraste si el valor medio difiere significativamente del valor certificado.

Problema 6.14 La tabla recoge los resultados de la medida de una propiedad mediante dos tcnicas
experimentales diferentes.

Lote Ensayo espectromtrico UV Espectroscopa de reflectancia en el IR cercano


1 84.63 83.15
2 84.38 83.72
3 84.08 83.84
4 84.41 84.20
5 83.82 83.92
6 83.55 84.16
7 83.92 84.02
8 83.69 83.60
9 84.06 84.13
10 84.03 84.24

Son las diferencias entre pares de medidas significativas?.

Problema 6.15 Los siguientes datos proporcionan la recuperacin de brofnuro adicionado a mues-
tras con contenido vegetal, medido mediante un mtodo cromatogrfico gas-lquido. La cantidad de
bromuro potsico aadido a cada tipo de vegetal fue la misma.

Tomate (g.g1 ) 777 790 759 790 770 758 764


Pepino (g.g1 ) 782 773 778 765 789 797 782

(a) Contrastar si la recuperacin en los dos vegetales tiene varianzas, que difieran significativa-
mente.
(b) Contrastar si las tasas de recuperacin medias difieren significativamente.
Siete medidas del pH de una solucin reguladora proporcionaron los siguientes resultados:

127
6.8 6.8. Ejercicios y problemas

Problema 6.16 La siguiente tabla proporciona la concentracin de norepinefrina (mol por g de


creatinina) en la orina de voluntarios sanos de veinte aos.

Hombres 0.48 0.36 0.55 0.45 0.46 0.47


Mujeres 0.35 0.37 0.27 0.29

Existe evidencia que la concentracin de norepinefrina difiera entre sexos?

Problema 6.17 Seis anlisis repetidos de otra muestra proporcionaron los siguientes valores:
13,8 14,0 13,2 11,9 12,0 12,1 ng.ml1
Calcular la media, desviacin estndar, desviacin estndar relativa de estos resultados y lmites de
confianza de la media al 99

Problema 6.18 La siguiente tabla recoge resultados de un trabajo en el que fueron comparados dos
mtodos diferentes para la determinacin de cromo en materiales orgnicos.

Agujas de pino Mtodo 1 media= 2.15 d.e. = 0.26


Mtodo 2 media =2.45 d.e. = 0.14
Hojas de haya Mtodo 1 media= 5.12 d.e. = 0.80
Mtodo 2 media =7.27 d.e. = 0.44
Planta acutica Mtodo 1 media= 23.08 d.e. = 2.63
Mtodo 2 media =32.01 d.e. = 4.66

En cada caso la media es el promedio de 5 valores.


Para cada material probar si la media de los resultados obtenidos por los dos mtodos difiere
significativamente.

Problema 6.19 Un nuevo procedimiento enzimtico de anlisis por inyeccin en flujo para determi-
nar perxido de hidrgeno en agua fue comparado con un mtodo volumtrico redox convencional
con permanganato potsico aplicando ambos mtodos a muestras de perxido de uso farmacutico.
La siguiente tabla proporciona la cantidad de perxido de hidrgeno, en mg.ml1 . Cada valor es
la media de cuatro rplicas.

Muestra Mtodo enzimtico Mtodo del permanganato


1 31.1 32.6
2 29.6 31.0
3 31.0 30.3

Probar si los resultados obtenidos por ambos mtodos difieren significativamente.

Problema 6.20 Las siguientes cifras se refieren a la concentracin de albmina, en gl1 , en el suero
sanguneo de 16 adultos sanos:

Hombres 37 39 37 42 39 45 42 39
Mujeres 44 40 39 45 47 47 43 41

Difiere significativamente la concentracin media para hombres y mujeres?.

128
6 6.Intervalos de probabilidad e intervalos de confianza

Problema 6.21 Se compar un nuevo mtodo espectroscpico de absorcin atmica de llama para
determinar antimonio en la atmsfera con el mtodo colorimtrico recomendado. Para muestras de
atmsfera urbana, se obtuvieron los siguientes resultados:

Antimonio encontrado (mg.m3 )


Muestra Mtodo nuevo Mtodo estndar
1 22.2 25.0
2 19.2 19.5
3 15.7 16.6
4 20.4 21.3
5 19.6 20.7
6 15.7 16.8

Hay diferencias significativas entre los resultados obtenidos por los dos mtodos?

129
6.9 6.9. Lecturas recomendadas

6.9. Lecturas recomendadas


Para completar la preparacin de este tema recomendamos la lectura de:

Captulo 3. Contrates de significacin. del texto de Miller y Miller[3]. XX

Chapter 7. Point Estimators, Confidence Intervals del texto de Graham[2]


til para completar el estudio del tema

Chapter 6. The Precission and Accuracy of Measurements del texto de Mandel[4]


til para completar el estudio del tema

130
7

Clculo de errores

Contenidos Calculo de errores en medidas directas. Clculo de errores. Deses-


timacin de medidas: el test Q de Dixon. El test de la de Thompson
modificada.
Calculo de errores en medidas indirectas Error de escala: determina-
cin del error mximo y ms probable. Error aleatorio. Combinacin de
errores.
Media ponderada de medidas independientes
Objetivos Reconocer
Reconocer
Realizar
Comprender
Conocer
Comprender
Utilizar

131
7.1 7.1. Clculo de errores en medidas directas

7.1. Clculo de errores en medidas directas


En general podemos expresar el resultado de una medida como

x = i
donde la incertidumbre, i , podemos expresarla como

i = sistemtico + escala + aleatorio


Nuestro objetivo es estimar la magnitud de cada una de estas incertidumbres que pasaremos a
discutir una a una.

7.1.1. Errores de escala


La contribucin del error de escala a la incertidumbre la podemos considerar constante para cada
medida. Utilizaremos como valor del error de escala la mitad de la escala de medida del aparato, a no
ser que las especificaciones del aparato indiquen lo contrario.

7.1.2. Errores de sistemticos


La determinacin de los errores sistemticos no es siempre sencilla. En los casos ms benignos
son constantes o varan de manera conocida (por ejemplo, si utilizamos un aparato mal calibrado)
y las medidas pueden corregirse. En general, para acotar los errores sistemticos es necesario hacer
experimentos de calibrado y utilizar tcnicas de diseo de experimentos.
En este curso supondremos que los errores sistemticos estn enmascarados por otras fuentes de
error.

7.1.3. Errores accidentales o aleatorios


Para estimar su valor tenemos que proponer un modelo para la funcin de distribucin de proba-
bilidad de las medidas. En adelante supondremos que nuestras medidas estn distribuidas de acuerdo
con una funcin de distribucin gaussiana o que podemos utilizar el teorema del lmite central. Para
decidir si la incertidumbre en las medidas se ajusta a este modelo debemos hacer uso de las tcnicas
de ensayo de hiptesis y diseo de experimentos.
Supongamos que tenemos n medidas independientes x1 , x1 , . . ., xn de una magnitud obtenidas
en un mismo aparato, utilizando el mismo mtodo e iguales condiciones iniciales. Esta condicin
equivale a decir que las medidas son muestras de la misma poblacin y estn caracterizadas por
la misma distribucin de probabilidad. Si suponemos que los errores estn distribuidos de acuerdo
con una distribucin gausiana, el valor de la magnitud a determinar coincidir con su media, . La
incertidumbre en las medidas estar relacionada con su desviacin tpica, (x), que es una medida de
la dispersin de los datos alrededor de la media di = xi .
Si no conocemos ni ni (x) slo podemos estimar su valor. Para determinar las estimas de
y (x) tenemos que utilizar mtodos de determinacin de estimas. Frecuentemente se utilizan las
tcnicas de mxima verosimilitud y el mtodo de mnimos cuadrados. Aplicando estos mtodos se
obtiene:

132
7 7.Clculo de errores

(1) La estima de la media general de la magnitud coincide con la media aritmtica x, de las obser-
vaciones:
n
1X
x = xi
n i=1

(2) ) La estima de la varianza de las medidas es la varianza muestral

n
1 X
2
s (x) = (xi x)2
n 1 i=1

(3) y la varianza de la media muestral viene dada por

s2 (x)
s2 (
x) =
n

Para estimar el grado de proximidad de la media muestral, x, a la media poblacional, , utilizare-


mos el intervalo de confianza de la media. Los lmites del intervalo de confianza se fijan de manera
que la media est contenida en este intervalo con una probabilidad predeterminada. En general se
emplean valores del coeficiente de confianza, 1 , entre 1 = 0,95 y 1 = 0,99.
Indicaremos el resultado de nuestras medidas como

(x)
x k1 2 (7.1)
n

si conocemos, , si (x) es desconocida.

s(x)
x t1 2 ( = n 1) (7.2)
n

Note que k = 1,96(1 = 0,95) y k = 2,575(1 = 0,95).

Ejemplo 1. Clculo de incertidumbres (I)


En la determinacin de la molaridad de una disolucin de cido sulfrico por valoracin con
hidrxido sdico de concentracin conocida, se han obtenido los siguientes resultados: 0.4311,
0.4315, 0.4310, 0.4313, 0.4312 y 0.4311 M.
Determine el valor medio, la desviacin tpica de las medidas, la desviacin tpica de la media
muestral y la incertidumbre (error accidental) con un nivel de confianza del 95 %.

133
7.2 7.1. Clculo de errores en medidas directas

i xi di = xi x di2
1 0.4311 1103 1,106
2 0.4315 +3103 9,106
3 0.4310 2103 4,106
4 0.4313 +1103 1,106
5 0.4312 0103 0,106
6 0.4311 1103 1,106
X X X
n=6 xi = 2,5872 di = 0 d2i = 1,6 105
sP
d2i s(x)
x = 0,4312 M s(x) = = 1.7899103 M x) = = 7,304104
s(
n1 n
Dado que (x) es desconocida.

s(x)
x t1 2 ( = n 1)
n
t.975 ( = 5) = 2,57
[H2 SO4 ] = 0,431 0,002 M

Ejemplo 2. Clculo de incertidumbres (II)


Diez medidas del cociente de reas de dos picos en un experimento de cromatografa lquida
dieron los siguientes resultados: 0.4911, 0.4898, 0.4923, 0.4919, 0.4999, 0.4961, 0.4947, 0.4986,
0.4902, 0.4822.
Determine el valor medio, la desviacin tpica de las medidas, la desviacin tpica de la media
muestral y la incertidumbre (error accidental) con un nivel de confianza del 95 %.
X X X
n = 10 xi = 4,9268 di = 0 d2i = 2,3 104
sP
d2i s(x)
x = 0,4927 s(x) = x) = = 0,0016
= 0,0051 s(
n1 n
Dado que (x) es desconocida.

s(x)
x t1 2 ( = n 1)
n
t.975 ( = 9) = 2,26
x = 0,4927 2,26 0,0016 = 0,4927 0,0036

134
7 7.Clculo de errores

7.2. Desestimacin de medidas


Puede suceder que algunas medidas se alejen demasiado del resto por lo que pueden considerarse
como poco representativas de las magnitudes que se quieren medir. Estas medidas deben eliminarse
ya que utilizarlas afecta al valor de las estimas de las magnitudes que queremos calcular.
Consideramos que una medida es errtica cuando la probabilidad de obtener ese valor es muy baja.
Podemos considerar que una medida es poco probable cuando est fuera del intervalo de confianza,
sin embargo este criterio slo es fiable si el nmero de medidas es relativamente grande (n >10) o se
conoce con gran exactitud.
Cuando el nmero de observaciones es pequeo tenemos que utilizar otro criterio.Vamos a consi-
derar dos mtodos para detectar medidas errticas:

El ensayo de la Q de Dixon

La tcnica de la de Thompson modificada

7.2.1. El ensayo de la Q de Dixon

En este mtodo se comparan la diferencia entre el valor sospechoso y la medida ms prxima a


ste con el rango de las medidas (diferencia entre el mayor y menor valores observados: xmax y xmin ).
La variable que utilizamos como referencia es el cociente de ambas magnitudes, la Q de Dixon:

xsospechoso xms prximo


Q= (7.3)
xmximo xmnimo

Si el valor de Q es mayor que el valor crtico de Q para un nivel de confianza del 95 % desestima-
remos el valor sospechoso.

n 4 5 6 7 8 9 10
Qcrit 0.831 0.717 0.621 0.570 0.524 0.492 0.464

Cuadro 7.1: Valores crticos de Q con un nivel de confianza del 95 %

Ejemplo 3. Desestimacin de valores mediante el mtodo de la Q de Dixon


En la medida de una cintica de primer orden se obtuvieron los siguientes valores de k (s1 ):
4.51, 4.54, 4.52, 4.66, 4.51, 4.50, 4.48, 4.49, 4.51, 4.52.
Determine el valor de k. Verifique si tiene que despreciar alguna de las observaciones.

135
7.2 7.2. Desestimacin de medidas

A partir de los datos experimentales podemos obtener

i 1 2 3 4 5 6 7 8 9 10
ki 4.51 4.54 4.52 4.66 4.51 4.50 4.48 4.49 4.51 4.52
ki k 0.01 0.02 0.00 0.14 0.01 0.02 0.04 0.03 0.00 0.01

k = 4.52 s1 , s(k) = 0.05 s1 , s(k)


= 0.02 s1
Para la medida 4, k4 k  s(k). Esta medida parece sospechosa.
Determinaremos si hay que despreciar la medida 4:
4,66 4,54
Qexp = = 0,67 > Qcrit (n = 10) = 0,452
4,66 4,48
Descartamos la medida de k= 4.66 y repetimos el clculo de Qexp .
4,54 4,52
Qexp = = 0,33 < Qcrit (n = 9) = 0,492
4,54 4,48
No descartamos ningn otro dato. Repitiendo los calculo obtenemos k = 4.51 s1 , s(k) = 0.018
= 0.006 s1 .
s1 , s(k)

k = 4,51 0,01 s1
con un nivel de confianza del 95 %.

Sin embargo, este mtodo no es til si en la muestra estn presentes dos valores errticos muy
prximos o muy separados entre si. Por ejemplo considere los valores:

2.1 2.0 2.1 2.3 2.9 2.3 3.1 2.2 2.0 2.3

En este caso

3,1 2,9
Qexp = = 0,18 < Qcrit (n = 10) = 0,464
3,1 2,0
el mtodo no es capaz de discernir la presencia de dos valores errticos muy prximos. Es necesario
aplicar tcnicas que tenga en cuenta la posibilidad de observar dos o ms valores errticos.

7.2.2. La tcnica de la de Thompson modificada


Este es el mtodo recomendado en el documento Measurement Uncertainty (ANSI/ASME, 1986).
En este mtodo se siguen los siguientes pasos:

(1) Se calcula la media x y la desviacin tpica s(x) de las n medidas.

(2) Se ordenan las medidas de menor a mayor.

(3) Los valores mnimo y mximo son marcados como posibles valores errticos (outliers).

136
7 7.Clculo de errores

Figura 7.1: Ilustracin de un ejemplo donde el test Q de Dixon no es capaz de discirminar los datos
errticos. Este ejemplo ilustra la importancia de hacer una representacin grfica de los datos.

(4) Para es los dos valores sospechosos se calcula el valor absoluto de su desviacin respecto de la
media:
i = |xi x| (7.4)

(5) El mayor valor de i se compara con el producto s(x), donde depende del nmero de
medidas realizadas (ver tabla 7.2).

(6) Si i > s(x) se desecha xi y se repiten los pasos (1) a (5) hasta que el valor con mayor i
cumpla i < s(x)

n 3 4 5 6 7 8 9 10 11 12 13
1.150 1.393 1.572 1.656 1.711 1.749 1.777 1.798 1.815 1.829 1.840
Cuadro 7.2: Valores de la de Thompson para distintos nmeros de medidas

137
7.3 7.3. Clculo de errores de medidas indirectas

Ejemplo 4. Desestimacin de valores mediante el mtodo de de Thompson modificada


Nueve medidas de conductividad de una disolucin dieron los siguientes resultados: 12.02,
12.05, 11.96, 11.99, 12.10, 12.03, 12.00, 11.95, 12.16 mS.
Determine si hay algun valor errtico
(1) Calculamos c y s(x).

c = 12.03 mS
s(c) = 0.07 mS
(2) Calculamos min y max .

min = |cmin - c| = |11.95 - 12.03| = 0.08 mS


max = |cmax - c| = |12.16 - 12.03| = 0.13 mS
(3) Calculamos el valor crtico de . Con n = 9, = 1,777.

crit = 1,777 0,07 = 0,12


(4) Rechazamos el valor xmax .
Cuando repetimos el proceso obtenemos c= 12.01 mS, s(c) = 0.05 mS, y ningn valor deber
desecharse.

7.3. Clculo de errores de medidas indirectas


En este caso la magnitud que queremos determinar, , no se puede medir directamente sino que
se expresa como una funcin de n magnitudes mensurables 1 , 2 , . . ., n .
Como de las magnitudes 1 , 2 , . . ., n tienen un error experimental, slo podemos obtener sus
estimas experimentales x1 , x2 , . . ., xn .
Cmo podemos estimar el valor de y acotar su incertidumbre?. Se puede demostrar que una
estima quasi-insesgada de es

y = f (
x1 , x2 , ..., xn ) (7.5)
Al igual que para medidas directas podemos escribir

y = + (y) (7.6)
donde

(y) = sist (y) + escala (y) + aleatorio (y) (7.7)


Como en el estudio de las magnitudes directas ignoramos los errores sistemticos. Si fueran co-
nocidos su tratamiento seria semejante al error de escala.

138
7 7.Clculo de errores

A la hora de evaluar la incertidumbre de las medidas podemos considerar tres casos:

Slo es necesario considerar el error de escala. Este es el caso en el que no podemos estimar
aleatorio , o escala  aleatorio .

Slo es necesario considerar el error aleatorio: escala  aleatorio .

Las magnitudes de escala y aleatorio son comparables y no podemos despreciar ninguno.

139
7.3 7.3. Clculo de errores de medidas indirectas

140
Parte I

Apndices

141
APNDICE A

Tablas estadsticas

A.1. rea bajo la curva normal tipificada

143
A.2 A.1. rea bajo la curva normal tipificada

144
A A.Tablas estadsticas

A.2. Valores de las percentilas tp para un distribucin t de Stu-


dent con grados de lbertad

145
A.3A.3. Valores de las percentilas 2p para un distribucin 2 de Student con grados de lbertad

A.3. Valores de las percentilas 2p para un distribucin 2 de Stu-


dent con grados de lbertad

146
A A.Tablas estadsticas

A.4. Valores de las percentilas F0,95(1, 2) para un distribucin


F
Recuerde que 1 es el nmero de grados de libertad del numerador y 2 es el nmero de grados de
libertad del denominador.

147
A.5 A.5. Valores de las percentilas F0,99 (1 , 2 ) para un distribucin F

A.5. Valores de las percentilas F0,99(1, 2) para un distribucin


F
Recuerde que 1 es el nmero de grados de libertad del numerador y 2 es el nmero de grados de
libertad del denominador.

148
Bibliografa

[1] P. R. Bevington and D. K. Robinson. Data Reduction and Error Analysis for the Physical Scien-
ces. Second edition. McGraw-Hill, New York, 1994.

[2] Richard C. Graham. Data Analisis for the Chemical Sciences. VCH, New York, 1993. X.

[3] Jane C. Miller James N. Miller. Estadstica y Quimiometra para Qumica Analtica. Prentice
Hall, Madrid, 2002. X.

[4] John Mandel. The Statistical Analysis of Experimental Data. Dover, New York, 1984.

[5] R. Alu Srinivasan Murray R. Siegel, John Schiller. Probabilidad y Estadstica. Coleccin
Schaum. McGraw-Hill, Bogot, 2a edition, 2001.

[6] R.H. Myers R. Walpole. Probabilidad y Estadstica. McGraw-Hill, Madrid, 1992.

[7] V. P. Spiridonov and A. A. Lopatkin. Tratamiento matemtico de datos fisicoqumicos. Segunda


edicin. MIR, Mosc, 1983. TC X.

149
ndice alfabtico

desestimacin de medidas, 135 Intervalos de confianza, 109, 112


Q Dixon, 135 de diferencia de las medias, 117
distribucin de la media, 113
uniforme, 50 de la varianza, 116
binomial, 51 definicin, 109
2 , 84 diferencia de la media para datos empare-
de Bernuilli, 51 jados, 120
de Poisson, 55 intervalos de probabilidad
relacin con distribucin binomial, 57 definicin, 106
relacin con distribucin normal, 58, 80 para las medias, 108
F de Fisher, 88 para las medidas, 107
Gaussiana, 70 para las varianzas, 108
normal, 70
ley de los grandes nmeros, 18
t de Student, 80
relacin con distribucin normal, 80 media muestral, x, 39, 133
uniforme continua, 69 mediana, 44
medida errtica, 135
error moda, 44
error de escala, 7
error de truncamiento, 11 precisin, 8
error absoluto, 6 prueba de Bernuilli, 51
espacio muestral, 16
esperanza matemtica redondeo, 11
media, 35, 39
sesgo, 8
x , 39
momentos centrales, 35 teorema de Moivre, 55, 79
momentos de una distribucin, 35 teorema del lmite central, 78
momentos respecto del origen, 35
propiedades, 34, 35 varianza, 2 (x), 39
varianza, 35 varianza muestral, s2 (x), 42, 133
exactitud, 8

incertidumbre, 6

150

También podría gustarte