Está en la página 1de 9

DISTRIBUCIÓN GAUSSIANA

ESTADÍSTICA EN LA ANALÍTICA
La distribución Gaussiana es una suave curva ideal, que
DISTRIBUCIÓN GAUSSIANA, MEDIA Y DISTRIBUCIÓN ESTÁNDAR, DESVIACIÓN ESTÁNDAR Y se construye a partir de una serie de datos numéricos
PROBABILIDAD, INTERVALO DE CONFIANZA, COMPARACIÓN DE MEDIAS, GRÁFICOS DE con errores puramente aleatorios.
CONTROL, TEST Q DE DATOS SOSPECHOSOS Si se repite una experiencia un gran número de veces, los
resultados tienden a agruparse simétricamente en torno
al valor medio, sin embargo, en química analítica es más
probable que repitamos una experiencia de tres a cinco
veces, de esta pequeña serie de resultados podemos
estimar los parámetros estadísticos que caracterizan a
una serie grande.

DISTRIBUCIÓN GAUSSIANA DISTRIBUCIÓN GAUSSIANA


ME DI A Y DE S VI ACI ÓN E S T ÁNDAR ME DI A Y DE S VI ACI ÓN E S T ÁNDAR

En un caso hipotético, un fabricante de bombillas midió La media aritmética o promedio, es la suma de los
la duración de 4768 bombillas eléctricas. La gráfica de valores medidos y divididos por n, el número de
barras muestra el número de bombillas que tienen una medidas.
duración dentro de cada intervalo de 20 horas. ∑ ! !!
!=
Los tiempos de vida de las bombillas y la correspondiente $
curva gaussiana se caracterizan por dos parámetros, la
media aritmética o promedio y la desviación estándar. La desviación, s, es una medida del grado de proximidad
de los datos de la media.
"
∑ #! $#
!
s= %$&
DISTRIBUCIÓN GAUSSIANA
DISTRIBUCIÓN GAUSSIANA DESVI ACI ÓN EST ÁNDAR Y PROBABAL I DAD
ME DI A Y DE S VI ACI ÓN E S T ÁNDAR
La fórmula de la curva gaussiana es
Ejemplo: Supongamos que se han hecho las siguientes 4 1 # #
)= - $ #$( ⁄)*
medidas: 821, 783, 834 y 855. Hallar la media y la * 2,
desviación estándar.
821 + 783 + 834 + 855 Donde - (= 2.71828…) es la base de los logaritmos
!=
4 naturales. Para una serie finita de datos se aproxima µ a
! = 823.2 ! y σ a ..
En la ecuación se representa σ = 1 y µ = 0 por razón de
(821−823.2)2 + (783−823.2)2 + (834−823.2)2 + (855−823.2)2
&= simplicidad. El valor máximo de ) está en ! = µ, y la
4−1
curva simétrica en torno a ! = µ. Dado que la suma de las
s = 30.3
probabilidades de todas las medidas es la unidad, el área
bajo la curva debe ser la unidad.

DISTRIBUCIÓN GAUSSIANA DISTRIBUCIÓN GAUSSIANA


DESVI ACI ÓN EST ÁNDAR Y PROBABAL I DAD DESVI ACI ÓN EST ÁNDAR Y PROBABAL I DAD

Es útil expresar la desviación respecto al valor medio en Ejemplo: Supongamos que el fabricante de bombillas se
múltiplos de la desviación estándar. Es decir, ofrece cambiar libre de cargo cualquier bombilla que se
transformamos ! en /, de acuerdo con: funda en menos de 600 horas. ¿Qué fracción de bombillas
!−0 !−! debería tener disponibles para las situaciones?
/= ≈
* . !−! 600 − 845.2
/= /= / = −2.60
La probabilidad de medir / en un cierto intervalo es . 94.2
igual al área de ese intervalo. Por ejemplo, la El área debajo de la curva entre el valor medio y / =
probabilidad de observar / entre -2 y -1 es 0.136. Esta − 2.6 89:- 0.4953. Puesto que la curva total desde −∞
probabilidad corresponde al área rayada en la figura. 9: 89:=> ?-@A= -. 0.500, -: 9>-9 @-C- .-> 0.0047.
Es decir, la fracción de bombillas debe ser 0.47%.
DISTRIBUCIÓN GAUSSIANA DISTRIBUCIÓN GAUSSIANA
DESVI ACI ÓN EST ÁNDAR Y PROBABAL I DAD DESVI ACI ÓN EST ÁNDAR Y PROBABAL I DAD

Ejemplo: ¿Qué fracción de bombillas es de esperar que


tengan una duración entre 900 y 1000 horas? ! 0 0 0.582 = ! 0 0 0.5 + ! 0.5 0 0.582
#−# 900 − 845.2 ! 0 0 0.582 = 0.1915 + 0.0281
!= != ! = 0.582
% 94.2 ! 0 0 0.582 = 0.2196
#−# 1000 − 845.2 Para hallar el área entre # y 1000 h ! = 1.643 ,
!= != ! = 1.643
% 94.2 interpolando entre ! = 1.6 0 1.7
0.582 − 0.500 ! 0 0 1.643 = 0.4496
! 0.500 0 0.582 = × 0.2258 − 0.1915
0.600‒ 0.500 El área entre 900 y 1000 es 0.4496 − 0.2196 = 0.2300.
! 0.500 0 0.582 = 0.82 × 0.0343 Es decir, se espera que el 23.00% de las bombillas
! 0.500 0 0.582 = 0.028126 tengan una duración entre 900 y 1000 h.

INTERVALOS DE CONFIANZA
DISTRIBUCIÓN GAUSSIANA
CÁL CUL O DE I NT ERVAL OS DE CONFI ANZA

DESVI ACI ÓN EST ÁNDAR Y PROBABAL I DAD Si se dispone de un número limitado de medidas, no
podemos hallar la verdadera media de la población, Z, o
La desviación estándar mide la anchura de la curva de
la verdadera desviación estándar, 5. Lo que podemos
Gauss. Cuanto mayor es el valor de 5 más ancha es la
determinar es # y %, la media muestral y la desviación
curva. En toda curva de Gauss, el 68.3% del área está
estándar muestral.
comprendida en el intervalo desde μ − 15 hasta μ + 15.
∑ #! $# "
Supongamos que se usan dos técnicas diferentes para s= !
%$&
determinar el contenido en azufre de una muestra de
El intervalo de confianza es una expresión que indica
carbón, y que los métodos A y B tienen una desviación
que es probable que la verdadera media, Z, esté a una
estándar de 0.4% y 1.1%, respectivamente. Se puede
distancia de la media medida, #.
esperar que aproximadamente 2/3 de las medidas del
método A estén dentro del 0.4% de la media. Para el \%
Z=#±
método B, estarán dentro de 1.1% de la media. ]
INTERVALOS DE CONFIANZA INTERVALOS DE CONFIANZA
CÁL CUL O DE I NT ERVAL OS DE CONFI ANZA CÁL CUL O DE I NT ERVAL OS DE CONFI ANZA

Ejemplo: Se determina el contenido en hidrato de carbono En la tabla, encontramos el valor de t para intervalos de
de una glucoproteína, que resulta ser 12.6, 11.9, 13.0, 12.7 confianza del 50% en el cruce 50 y 4 grados de libertad.
y 12.5 g de hidrato por 100 g de proteína. Hallar los \%
Z=#±
intervalos de confianza del 50% y del 90% del contenido ]
en hidratos de carbono. (0.741)(0.40)
Z = 12.54 ±
∑ ! #! 12.6 + 11.9 + 13.0 + 12.7 + 12.5 5
#= #= = 12.5
] 5 Z = 12.54 ± 0.13
∑ #! $#
!
" El intervalo de confianza del 90% en el cruce 90 y 4 grados
s=
%$& de libertad.
&).,$&).- ! . &&./ $&).- ! . &0.1 $&).- ! . &).2 $&).- ! . &).- $&).- ! (2.132)(0.40)
s= -$& Z = 12.54 ±
5
s = 0.40
Z = 12.54 ± 0.38

COMPARACIÓN DE MEDIAS COMPARACIÓN DE MEDIAS


UTILIZANDO LA t DE STUDENT UTILIZANDO LA t DE STUDENT
CASO 1, 2 Y 3 CASO 1, 2 Y 3

Se usa el test t para comparar un conjunto de medidas Caso 2. Se mide una cantidad varias veces con dos
con otro, y decidir si son o no son diferentes. métodos diferentes, que dan dos resultados distintos,
Arbitrariamente fijamos un nivel de probabilidad del cada uno con su desviación estándar.
95%, para concluir si dos medias difieren entre si. Si Caso 3. Se mide una vez la muestra 1 con el método A y
existe una probabilidad menor que el 95%, concluiremos otra vez con el método B, y no dan el mismo resultado.
que no difieren una de la otra. Existen tres casos que se Asimismo, se mide otra muestra, designada como 2, una
tratan de manera diferente: vez con el método A y otra con el método B, y los
Caso 1. Se mide una cantidad varias veces y se obtiene un resultados vuelven a ser diferentes. El procedimiento se
valor medio y una desviación estándar. El resultado se repite con n muestras diferentes.
compara con un resultado aceptado.
COMPARACIÓN DE MEDIAS COMPARACIÓN DE MEDIAS
UTILIZANDO LA t DE STUDENT UTILIZANDO LA t DE STUDENT
CAS O 1 : COMPARACI ÓN DE UN RE S UL T ADO ME DI DO CAS O 1 : COMPARACI ÓN DE UN RE S UL T ADO ME DI DO
CON UN VAL OR CONOCI DO CON UN VAL OR CONOCI DO

Se compró una muestra de carbón de material estándar Hallamos \345 con la siguiente ecuación:
de referencia, certificado por el NIST (National Institute # − bcdef ge]eg
\345 = ]
of Standards and Tachnology), que contenía 3.19% p de %
azufre. Se quería ensayar un nuevo método analítico 3.260 − 3.19
\345 = 4
para ver si reproducía el valor conocido. 0.041
Los valores medidos fueron 3.29, 3.22, 3.30, 3.23% p de
azufre, arrojando una media # = 3.260 y una desviación \345 = 3.415
estándar s = 0.041. ¿concuerda este resultado con el
valor conocido? Para hallarlo, se obtiene \345 y se \647 = 3.182
compara con \647 . Si \345 > \647 a un nivel de confianza Si \345 > \647 a un nivel de confianza del 95% se
del 95% se considera que los dos resultados son considera que los dos resultados son diferentes.
diferentes.

COMPARACIÓN DE MEDIAS COMPARACIÓN DE MEDIAS


UTILIZANDO LA t DE STUDENT UTILIZANDO LA t DE STUDENT
CAS O 1 : COMPARACI ÓN DE UN RE S UL T ADO ME DI DO
CAS O 2 : COMPARACI ÓN DE ME DI DAS RE PL I CADAS
CON UN VAL OR CONOCI DO

Se certifica que un material estándar de referencia de un


Se puede usar un test t para decidir si dos conjuntos de
suelo contiene 94.6 ppm de un contaminante orgánico.
medidas replicadas dan resultados “iguales” o
Ciertos resultados de un análisis dan valores de 98.6,
“diferentes”, a un nivel de confianza dado.
98.4, 97.2, 94.6 y 96.2 ppm. ¿Difieren estos resultados
Se puede tomar un ejemplo del trabajo de Lord Rayleigh,
del resultado esperado a un nivel de confianza del 95%?
premio Nobel en 1904 por el descubrimiento del gas
# = 97 s = 1.73
inerte argón.
# − bcdef ge]eg 97 − 94.6 En tiempos de Rayleigh se sabía que el aire seco estaba
\345 = ] \345 = 5
% 1.73 compuesto de aproximadamente 1/5 de oxígeno y 4/5
\345 = 3.102
de nitrógeno. Rayleigh eliminó todo el oxígeno de una
\647 = 2.776
muestra de aire y a continuación midió la densidad del
Como \345 > \647 a un nivel de confianza del 95% se
gas resultante y lo recogió en un volumen conocido, a
considera que los dos resultados son diferentes.
temperatura y presión constante.
COMPARACIÓN DE MEDIAS COMPARACIÓN DE MEDIAS
UTILIZANDO LA t DE STUDENT UTILIZANDO LA t DE STUDENT
CAS O 2 : COMPARACI ÓN DE ME DI DAS RE PL I CADAS CAS O 2 : COMPARACI ÓN DE ME DI DAS RE PL I CADAS

Preparó también el mismo volumen de N 2 puro, por Veamos cómo se puede usar el test t para decidir si el gas
descomposición química del óxido nitroso. aislado del aire es “significativamente” más pesado que
La masa media recogida del aire (2.31011 g) resultó se el N 2 aislado por vía química. En este caso, tenemos dos
0.46% mayor que la masa media del mismo volumen de conjuntos de medidas y no un valor “conocido”.
gas procedente de productos químicos (2.29947 g). Suponer que la desviación estándar de la población (σ)
Si las medidas de Rayleigh no se hubieran hecho con de cada método es prácticamente la misma.
cuidado, esta diferencia se podría atribuir a un error Para dos conjuntos de medidas, que tienen n 1 y n 2
experimental. Sin embargo, Rayleigh entendió que la medidas (con medias #& y #) ) se calcula el valor de t con
discrepancia estaba fuera del margen de error y postuló la fórmula:
que el gas recogido del aire era una mezcla de N 2 y una #$ $## %$ %#
\345 =
pequeña cantidad de un gas más pesado, que mas tarde 8%&'( %$ .%#

resultó ser el argón.

COMPARACIÓN DE MEDIAS COMPARACIÓN DE MEDIAS


UTILIZANDO LA t DE STUDENT UTILIZANDO LA t DE STUDENT
CAS O 2 : COMPARACI ÓN DE ME DI DAS RE PL I CADAS CAS O 2 : COMPARACI ÓN DE ME DI DAS RE PL I CADAS

La desviación estándar combinada, %39:7 , utiliza los dos Ejemplo: La masa del gas obtenido del aire es de

conjuntos de datos. Si la \345 es mayor que la \647 a un #& = 2.31011 g, con una desviación estándar de

nivel de confianza dado, los dos resultados se consideran %& = 0.00014 3 (para ]& = 7 medidas). La masa del

diferentes. gas obtenido por vía química es #& = 2.29947 g, con


%& = 0.00138 (] ) = 8 medidas).
)
∑ #! − #& ) + ∑ #; − #& #
1.111&<0 2$& .1.11&0= =$&
#
%39:7 = %39:7 = 2.=$)
]& + ] ) − 2
%39:7 = 0.00102
%&) ]& − 1 + %)) ] ) − 1 ).0&1&& $ ).)//<2 2×=
%39:7 = \345 = \345 = 20.2
]& + ] ) − 2 1.11&1) 2.=

Como \345 > \647 a un nivel de confianza del 95% se


considera que los dos resultados son diferentes.
COMPARACIÓN DE MEDIAS COMPARACIÓN DE MEDIAS
UTILIZANDO LA t DE STUDENT UTILIZANDO LA t DE STUDENT
CAS O 2 : COMPARACI ÓN DE ME DI DAS RE PL I CADAS CAS O 2 : COMPARACI ÓN DE ME DI DAS RE PL I CADAS

Si se supone que la desviación estándar de la Ejemplo: El contenido de Ti (%p) de 5 muestras


población (σ) de cada método no es la misma. diferentes de mineral (cada una con un contenido
diferente de Ti) se mide con dos métodos distintos.
#& − # )
\345 = ¿Dan resultados significativamente distintos las dos
%&) %)) técnicas analíticas a un nivel de confianza del 95%?
+
]& ] ) 1.1&00)$1.1&<1)
\345 =
).#+×$- .+ +.0+×$- .+
En el caso de los datos de Rayleigh, se puede .
/ /
sospechar que la desviación estándar de la \345 = 1.318
población de datos a partir del aire es menor que la \647 = 2.776
de los datos a partir del proceso químico. Como \345 < \647 a un nivel de confianza del 95% se
considera que los dos resultados son iguales.

COMPARACIÓN DE MEDIAS COMPARACIÓN DE MEDIAS


UTILIZANDO LA t DE STUDENT UTILIZANDO LA t DE STUDENT
CAS O 3 : COMPARACI ÓN DE PARE S DE ME DI DAS CAS O 3 : COMPARACI ÓN DE PARE S DE ME DI DAS

En este caso se trata de dos métodos distintos, con Para contestar a esta cuestión se aplica el test t a las
los que se hace una sola medida usando muestras diferencias individuales entre los resultados de
diferentes. No se duplica ninguna medida. cada muestra.
Por ejemplo, consideremos el contenido de i
colesterol de 6 conjuntos de plasma sanguíneo \345 = ]
%?
humano por dos técnicas diferentes. Cada muestra
)
tiene un contenido diferente de colesterol. El ∑ i! − i
%? =
método B da un resultado menor que el método A ]−1
en 5 de las 6 muestras. ! ! ! ! ! !
0.04 − 6 + −0.16 − 6 + 0.17 − 6 + 0.17 − 6 + 0.04 − 6 + 0.10 − 6
1" =
¿Es el método B sistemáticamente diferente del 6−1

método A? %? = 0.12 2
COMPARACIÓN DE MEDIAS
UTILIZANDO LA t DE STUDENT TEST Q DE DATOS SOSPECHOSOS
CAS O 3 : COMPARACI ÓN DE PARE S DE ME DI DAS PRUEBA DE DI XON

Introduciendo %? en \345 , se obtiene En ocasiones, un dato no es coherente con los


restantes. Se puede usar el test Q como ayuda para
i
\345 = ] decidir si se retiene o descarta un dato sospechoso.
%?
Para aplicar el test Q, se ordenan los datos en orden

0.06 0 creciente y se calcula Q definido como:


\345 = 6
0.12 2
klbmfnm]glc
j345 =
\345 = 1.20 omgefflie
\647 = 2.571
Como \345 < \647 a un nivel de confianza del 95% se Si j345 > j647 , el punto sospechoso se descarta, de
considera que los dos resultados son iguales. ser lo contrario se retiene.

TEST Q DE DATOS SOSPECHOSOS TEST Q DE DATOS SOSPECHOSOS


PRUEBA DE DI XON PRUEBA DE DI XON

Ejemplo: Consideremos los siguientes 5 resultados, Usando el test Q, decidir si se debe descartar el valor
12.53, 12.56, 12.47, 12.67 y 12.48. ¿Es el 12.67 un 216 de la siguiente serie de resultados: 192, 216,
“punto rechazable”? Divergencia
202, 195 y 204. Divergencia

12.47 12.48 12.53 12.56 12.67 192 195 202 204 216

Recorrido Valor sospechoso Recorrido Valor sospechoso

B!CDEFD%3!4 1.&& B!CDEFD%3!4 &)


j345 = j345 = j345 = 0.55 j345 = j345 = j345 = 0.5
GD39EE!?9 1.)1 GD39EE!?9 )<

En la tabla j647 = 0.64. Como j345 < j647 , el punto En la tabla j647 = 0.64. Como j345 < j647 , el punto
sospechoso se retiene. sospechoso se retiene.
LIDERAZGO REGIONAL

También podría gustarte