Está en la página 1de 52

Técnicas experimentales IV (avanzadas)

Conceptos de estadística

H. Alvarez Pol

GENP, Dpto. Física de Partículas, Universidade de


Santiago de Compostela

Técnicas experimentales IV
Grado en Física - G1031425
Técnicas experimentales Avanzadas
Licenciatura en Física - 201511

H. Alvarez Pol – Conceptos de estadística TEA (licenciatura) – TEIV (grado)


Índice de contenidos

1. Introducción. Consideraciones iniciales y definiciones básicas.


2. Incertidumbres y su tratamiento.
3. Los histogramas y las distribuciones de probabilidad.
4. Análisis estadístico de los datos.
5. Revisión de algunas distribuciones de probabilidad.
6. El test de Χ2.
7. Apéndice: nomenclatura básica de análisis estadístico y probabilidad.

H. Alvarez Pol – Conceptos de estadística 2 TEA (licenciatura) – TEIV (grado)


Medidas e incertidumbres

Toda medida está afectada por una incertidumbre, inherente al proceso de medida.
● Realizamos medidas (measurements) para intentar determinar un mensurando
(measurand) que no se conoce. Las medidas que realizamos son la mayor fuente de
información acerca de la magnitud a medir, mediante un estimador ó valor estimado
(estimator) adecuado y una expresión de su incertidumbre (uncertainty).
● Buscamos realizar medidas con la mayor exactitud (accuracy), esto es, resultados lo
mas cercanos al valor verdadero del mensurando. Cuando las variaciones obtenidas
mediante mediciones repetidas muestran una baja dispersión o variabilidad, se
denotan como de mayor precisión (precision) que aquellas con mayor dispersión en los
resultados.

H. Alvarez Pol – Conceptos de estadística 3 TEA (licenciatura) – TEIV (grado)


Medidas e incertidumbres: interpretación

Definición formal de incertidumbre en la medida [GUM93]:


Parámetro, asociado con el resultado de una medida, que caracteriza la
dispersión de los valores que se pueden atribuir razonablemente a un
mensurando.

Esta definición es consistente con otros conceptos de incertidumbre, como el de:


● medida de un posible error en el valor estimado del mensurando como
resultado de una medida;
● estimador que caracteriza el rango de valores dentro del que se cree que se
encuentra el valor real de un mensurando.

El problema de estas definiciones es que se centran en cantidades que no se


conocen, como “error” o “valor real” del mensurando.

Nota importante:
Determinar la incertidumbre de una medida no implica duda acerca de la
validez de la medida; al contrario, el conocimiento de las incertidumbres de la
medida implican un incremento de la confianza de la validez del resultado de la
medida.

H. Alvarez Pol – Conceptos de estadística 4 TEA (licenciatura) – TEIV (grado)


Fuentes de incertidumbre

Fuentes de incertidumbre en la medida:


● definición incompleta del mensurando;
● muestra no significativa, que no represente el mensurando adecuado;
●conocimiento inadecuado de los efectos del entorno en el proceso de medida o
medida imperfecta de las condiciones ambientales que afectan al proceso;
● sesgo personal en la medida de los instrumentos analógicos;
● resolución limitada en la instrumentación o umbrales de discriminación;
● valores inexactos de los estándares de medida o de los materiales de referencia;
● aproximaciones o suposiciones erroneas incorporadas en el proceso de medida;
●variaciones en las observaciones repetidas del mensurando bajo condiciones
aparentemente idénticas de medida.

H. Alvarez Pol – Conceptos de estadística 5 TEA (licenciatura) – TEIV (grado)


Tipos de incertidumbre

Definición formal de los tipos de incertidumbres en la medida [GUM93]:

Evaluacion de incertidumbre de tipo A:


Se evaluan a partir de series de observaciones repetidas utilizando la varianza o
desviación estándar de las funciones de densidad de probabilidad, derivadas de
las distribuciones de frecuencia de los resultados.
Evaluacion de incertidumbre de tipo B:
Se evaluan utilizando el conocimiento previo obtenido, tipificado como varianzas
o desviaciones estándar obtenidas de funciones de densidad de probabilidad
asumidas sobre la probabilidad de que ocurra un suceso (probabilidad subjetiva).

Estas categorías no sustituyen a “aleatorios” y “sistemáticos”, sino que se


refieren al método de evaluación de la incertidumbre, sin entrar en la naturaleza
de la variación en la medida. Ambas evaluaciones se realizan mediante el estudio
de distribuciones de probabilidad y se cuantifican como varianzas o desviaciones
estándar.

H. Alvarez Pol – Conceptos de estadística 6 TEA (licenciatura) – TEIV (grado)


Interpretación de errores

Definición formal de error en la medida [GUM93]:


diferencia entre el valor real del mensurando y el valor actual de la medida.

Esta definición tiene el problema de que el valor real del mensurando no se


conoce (y por tanto el error real no se conoce), así que se tiene que usar un valor
real “convencional”.

Los errores se separan de forma tradicional en dos componentes:



errores aleatorios (random errors), que provienen de variaciones estocásticas
temporales o espaciales en las variables que influyen en el mensurando; estos
errores se reducen incrementando el número de observaciones, de forma que su
valor esperado tienda a cero.
●errores sistemáticos (systematic errors), producidos por efectos reconocidos
que provocan desviaciones en la medida, y que deben cuantificarse y corregirse si
son significativos respecto a la exactitud requerida.

H. Alvarez Pol – Conceptos de estadística 7 TEA (licenciatura) – TEIV (grado)


Evaluación de incertidumbres

Evaluacion de incertidumbre de tipo A:

En la mayoría de los casos, el mejor estimador del valor esperado de una


cantidad que varía aleatoriamente (variable aleatoria x) de la que tenemos n
medidas independientes es la media aritmética o promedio:
̄x =(1/n) ∑ x i
El mejor estimador de la varianza (y de la desviación estándar) experimental de


las observaciones es: 1 1
2
s=
n−1
∑ (x i− ̄x )
2
s=
n−1
∑ (x i−̄x )2

(x i )
El mejor estimador de la varianza de la media es: 2
s (̄x )=s
2

n
esto es, un indicador de lo buena que es la medida de la muestra estimando el
valor esperado de la distribución de probabilidad.

Los grados de libertad (n-1, en el caso de que x i= X̄i y u(x i)=s( X̄i) ) deben
especificarse en las evaluaciones de incertidumbre de tipo A.

H. Alvarez Pol – Conceptos de estadística 8 TEA (licenciatura) – TEIV (grado)


Evaluación de incertidumbres

Evaluacion de incertidumbre de tipo B:

Para un estimador de una variable que no se ha obtenido a partir de


observaciones repetidas, el varianza u2(xi) estimada (o la incertidumbre estándar
u(xi)) se evalua a partir de juicio científico basado en las fuentes de información
disponibles sobre la distribución de probabilidad de xi.

Salvo que se especifique lo contrario, asumiremos distribuciones normales de


probabilidad en la asignación de incertidumbres de tipo B.

H. Alvarez Pol – Conceptos de estadística 9 TEA (licenciatura) – TEIV (grado)


Evaluación de incertidumbres de tipo B

Información de utilidad en la determinación de incertidumbres de tipo B:

● datos tomados previamente;


●conocimiento general o experiencia con el comportamiento o propiedades
de materiales relevantes o instrumentos de la medida;
● especificaciones del fabricante;
● datos obtenidos en calibraciones o en certificaciones de los aparatos;
●incertidumbres asignadas a datos de referencia o tomadas de bibliografía
sobre valores de referencia, ...

H. Alvarez Pol – Conceptos de estadística 10 TEA (licenciatura) – TEIV (grado)


Propagación de incertidumbres

Asumiremos que las cantidades se miden de forma independiente. Aplicaremos la


denominada ley de propagación de incertidumbres.

La incertidumbre estándar combinada uc(y) se obtendrá a partir de las


incertidumbres de las medidas, como la raiz cuadrada positiva de la varianza
combinada
( )
2
∂f
uc (y)=∑
2 2
u (x i) Y=f(X 1, X 2, X 3, ...)
∂ xi

donde cada u(xi) es la desviación estándar evaluada de acuerdo con el tipo de


incertidumbre de la medida.

Las derivadas parciales, denominadas coeficientes de sensibilidad, podrían


determinarse experimentalmente mediante la evaluación del cambio producido
en Y cuando se produce una variación determinada de la variable Xi.

H. Alvarez Pol – Conceptos de estadística 11 TEA (licenciatura) – TEIV (grado)


Como expresar las incertidumbres

Utilizaremos la incertidumbre estándar combinada uc(y) como el indicador de la


incertidumbre de nuestra(s) medida(s). Una expresión correcta de la
incertidumbre incluye:
● describir claramente los métodos usados para calcular los resultados y sus
incertidumbres;
●hacer una lista de los componentes de la incertidumbre y documentar como se
evaluaron;
●presentar el análisis de datos de forma que cada paso importante se pueda
entender y seguir y reproducir su cálculo de forma independiente;

dar todas las correcciones y constantes usadas en el análisis.

Pueden aplicarse las siguientes expresiones para la incertidumbre (ejemplo):


● Ms = 100.02147 g con uc = 0,35 mg
● Ms = 100.02147(35) g (incertidumbre afectando a los dos últimos dígitos)
● Ms = 100.02147(0.00035) g (incertidumbre en la misma unidad)
● Ms = (100.02147 ± 0.00035) g (no recomendado!)

H. Alvarez Pol – Conceptos de estadística 12 TEA (licenciatura) – TEIV (grado)


La medida

H. Alvarez Pol – Conceptos de estadística 13 TEA (licenciatura) – TEIV (grado)


Histogramas y distribuciones de probabilidad

Histograma

La suma de altura de las barras es el


número total de eventos!!

Distribución de probabilidad

La integral corresponde al número total


de eventos!!

Distribución de probabilidad
normalizada

La integral total es 1!!

H. Alvarez Pol – Conceptos de estadística 14 TEA (licenciatura) – TEIV (grado)


Tablas de resultados

H. Alvarez Pol – Conceptos de estadística 15 TEA (licenciatura) – TEIV (grado)


Medidas características de una distribución

H. Alvarez Pol – Conceptos de estadística 16 TEA (licenciatura) – TEIV (grado)


Medidas características de una distribución

H. Alvarez Pol – Conceptos de estadística 17 TEA (licenciatura) – TEIV (grado)


Medidas características de una distribución

H. Alvarez Pol – Conceptos de estadística 18 TEA (licenciatura) – TEIV (grado)


Medidas características de una distribución

H. Alvarez Pol – Conceptos de estadística 19 TEA (licenciatura) – TEIV (grado)


Análisis estadístico de los datos

H. Alvarez Pol – Conceptos de estadística 20 TEA (licenciatura) – TEIV (grado)


Distribuciones matemáticas y físicas

H. Alvarez Pol – Conceptos de estadística 21 TEA (licenciatura) – TEIV (grado)


Probabilidad y densidad de probabilidad

H. Alvarez Pol – Conceptos de estadística 22 TEA (licenciatura) – TEIV (grado)


Probabilidad y densidad de probabilidad

H. Alvarez Pol – Conceptos de estadística 23 TEA (licenciatura) – TEIV (grado)


Parámetros característicos de distribuciones

H. Alvarez Pol – Conceptos de estadística 24 TEA (licenciatura) – TEIV (grado)


Medidas característicos de distribuciones

H. Alvarez Pol – Conceptos de estadística 25 TEA (licenciatura) – TEIV (grado)


Probabilidad y densidad de probabilidad

H. Alvarez Pol – Conceptos de estadística 26 TEA (licenciatura) – TEIV (grado)


Probabilidad y densidad de probabilidad

H. Alvarez Pol – Conceptos de estadística 27 TEA (licenciatura) – TEIV (grado)


Sentido común!

H. Alvarez Pol – Conceptos de estadística 28 TEA (licenciatura) – TEIV (grado)


Bibliografía


[KNOLL] Radiation Detection and Measurement, G.F.Knoll, John Wiley &
Sons, NJ (2010).

●[SMEP72] Statistical Methods in Experimental Physics, W.T. Eadie, D.


Drijard, F.E. James, M. Roos, B. Sadoulet. North-Holland Publishing Company.
CERN, Geneva

●[GUM93] Guide To The Expression Of Uncertainty In Measurement. ISO,


Geneva (1993). (ISBN 92-67-10188-9) (Reprinted 1995).


[QUAM00] Quantifying Uncertainty in Analytical Measurement, Editors: S.L.
Ellison, M. Rosslein, A. Williams, EURACHEM/CITAC Guide CG4, Second edition


[BIMP93] International vocabulary of basic and general terms in
metrology, BIPM, IEC, IFCC, ISO, IUPAC, IUPAP, OIML, VIM. ISO, Ginebra, 1993.
(ISBN 92-67-10175-1)

H. Alvarez Pol – Conceptos de estadística 29 TEA (licenciatura) – TEIV (grado)


Distribuciones de probabilidad: binomial

H. Alvarez Pol – Conceptos de estadística 30 TEA (licenciatura) – TEIV (grado)


Distribuciones de probabilidad: binomial

H. Alvarez Pol – Conceptos de estadística 31 TEA (licenciatura) – TEIV (grado)


Distribuciones de probabilidad: Poisson

H. Alvarez Pol – Conceptos de estadística 32 TEA (licenciatura) – TEIV (grado)


Distribuciones de probabilidad: Poisson

H. Alvarez Pol – Conceptos de estadística 33 TEA (licenciatura) – TEIV (grado)


Distribuciones de probabilidad: Poisson

H. Alvarez Pol – Conceptos de estadística 34 TEA (licenciatura) – TEIV (grado)


Distribuciones de probabilidad: Gauss

H. Alvarez Pol – Conceptos de estadística 35 TEA (licenciatura) – TEIV (grado)


Distribuciones de probabilidad: Gauss

H. Alvarez Pol – Conceptos de estadística 36 TEA (licenciatura) – TEIV (grado)


Distribuciones de probabilidad: Gauss

H. Alvarez Pol – Conceptos de estadística 37 TEA (licenciatura) – TEIV (grado)


Distribución normal tipificada

H. Alvarez Pol – Conceptos de estadística 38 TEA (licenciatura) – TEIV (grado)


Distribuciones de probabilidad: Χ2

H. Alvarez Pol – Conceptos de estadística 39 TEA (licenciatura) – TEIV (grado)


Distribuciones de probabilidad: Χ2

H. Alvarez Pol – Conceptos de estadística 40 TEA (licenciatura) – TEIV (grado)


Test Χ2

H. Alvarez Pol – Conceptos de estadística 41 TEA (licenciatura) – TEIV (grado)


Test Χ2 de determinación paramétrica

H. Alvarez Pol – Conceptos de estadística 42 TEA (licenciatura) – TEIV (grado)


Test Χ2 de determinación paramétrica

H. Alvarez Pol – Conceptos de estadística 43 TEA (licenciatura) – TEIV (grado)


Test Χ2 de determinación paramétrica

H. Alvarez Pol – Conceptos de estadística 44 TEA (licenciatura) – TEIV (grado)


Test Χ2 de determinación paramétrica

H. Alvarez Pol – Conceptos de estadística 45 TEA (licenciatura) – TEIV (grado)


Estadística básica: nomenclatura

Estadística: una función de variables aleatorias muestreadas.


Estimación: operación de asignar, a partir de las observaciones en una muestra,
valores numéricos a los parámetros de una distribución elegidos a partir del
modelo estadístico de la población de la que la muestra se extrae.
Estimador: estadística utilizada para estimar un parámetro de la población.
Estimado: valor del estimador obtenido como resultado de una estimación.
Intervalo de confianza simétrico: para T1 y T2, funciones de los valores
observados tal que, para un parametro población θ que se estima, la probabilidad
Pr(T1≤ θ ≤ T2 ) es como mínimo igual a (1 – α), entonces el intervalo entre T1 y T2
es un intervalo con confianza (1 – α) simétrico para θ.
Intervalo de confianza asimétrico: cuando T es una función de los valores
observados tal que, para un parametro población θ que se estima, la probabilidad
Pr(T ≥ θ ) ( ó Pr(T ≤ θ) ) es como mínimo igual a (1 – α), entonces el intervalo
entre el mínimo valor de θ y T ( o de T al máximo valor de θ) es un intervalo con
confianza (1 – α) asimétrico para θ.
Nivel de confianza (o coeficiente de confianza): el valor (1 – α) asociado con un
intervalo de confianza o un intervalo de cobertura estadístico.

H. Alvarez Pol – Conceptos de estadística 46 TEA (licenciatura) – TEIV (grado)


Medidas e incertidumbres: nomenclatura

Cantidad (medible): atributo de un fenómeno, cuerpo o sustancia que se puede


distinguir cualitativamente y determinar cuantitativamente.
Valor (de una cantidad): magnitud de una cantidad particular expresado como
una unidad de medida multiplicada por un número.
Valor real (de una cantidad): valor consistente con la definición de una cantidad
particular. El obtenido de una medida perfecta y por naturaleza, indeterminado.
Valor real convencional: valor atribuido para una cantidad particular, aceptando,
en ocasiones por convenio, que tenga una incertidumbre apropiada a su uso.
Medida: conjunto de operaciones que conllevan a determinar el valor de una
cantidad.
Principio de medida: base científica de una medida.
Método de medida: secuencia lógica de operaciones, descritas genéricamente,
usadas en la realización de medidas.
Procedimiento de medida: conjunto de operaciones, descritas de forma
específica, utilizadas en la realización de medidas particulares de acuerdo con un
método de medida establecido.
Mensurando: cantidad particular sujeta a medida.
Cantidad influyente: cantidad que no es el mensurando pero que afecta al
resultado de la medida.

H. Alvarez Pol – Conceptos de estadística 47 TEA (licenciatura) – TEIV (grado)


Medidas e incertidumbres: nomenclatura

Resultado de una medida: valores atribuibles al mensurando, obtenidos


mediante una medida.
Resultados corregidos/no corregidos: aquellos después/antes de la corrección
por errores sistemáticos.
Exactitud de la medida: cercanía del acuerdo entre el resultado de una medida y
el valor real del mensurando (es un concepto cualitativo).
Repetitividad (de los resultados de una medida): cercanía del acuerdo entre los
resultados de sucesivas medidas del mismo mensurando realizadas bajo las
mismas condiciones de medida.
Reproducibilidad (de los resultados de una medida): cercanía del acuerdo entre
los resultados de medidas del mismo mensurando realizadas bajo condiciones
cambiantes de medida.
Desviación estándar experimental: para una serie de n medidas del mismo
mensurando, caracteriza a la dispersión de los resultados mediante la fórmula:


n
̄ )2
∑ (qk −q
k=1
s(qk )=
n−1
q la media aritmética de n resultados.
siendo qk el resultado de la medida k y ̄

H. Alvarez Pol – Conceptos de estadística 48 TEA (licenciatura) – TEIV (grado)


Medidas e incertidumbres: nomenclatura

Incertidumbre: parámetro, asociado con el resultado de una medida, que


caracteriza la dispersión de los valores que se pueden atribuir razonablemente a
un mensurando.
Error: diferencia entre una medida y el resultado del valor verdadero del
mensurando.
Error relativo: error de una medida dividido por el valor real del mensurando.
Error aleatorio: resultado de la medida menos el valor medio que resultaría de
infinitas medidas del mismo mensurando bajo condiciones de repetitividad.
Error sistemático: media que resultaría de un conjunto infinito de medidas de un
mensurando bajo condiciones de repetitividad, menos el valor real del
mensurando.
Corrección: valor añadido algebraicamente al resultado no corregido para
compensar por el error sistemático.
Factor de corrección: factor numérico por el cual se multiplica un resultado no
corregido para compensar por el error sistemático.

H. Alvarez Pol – Conceptos de estadística 49 TEA (licenciatura) – TEIV (grado)


Estadística básica: nomenclatura

Probabilidad: un número real entre 0 y 1 asociado a un evento aleatorio.


Variable aleatoria: una variable que puede tomar cualquiera de los valores de un
rango (discretos o continuos) y con la que se asocia una distribución de
probabilidad.
Distribución de probabilidad (de una variable aleatoria): una función que da la
probabilidad de que una variable aleatoria tome un valor dado o pertenezca a
una conjunto dado de valores o a un intervalo.
Función de distribución: una función que da, para cada valor de x, la
probabilidad de que la variable aleatoria X sea menor o igual que x: F (x)=Pr (X⩽x)
Función de densidad de probabilidad (de una variable continua aleatoria):
derivada de la función de distribución. f(x)=d F(x)/dx
Función de probabilidad: la función que da para cada valor de la variable
discreta xi la probabilidad pi de que la variable aleatoria sea igual a xi.
Parámetro: una cantidad usada para describir la distribución de probabilidad de
una variable.
Correlación: relación entre dos o más variables dentro de una distribución de dos
o más variables aleatorias.

H. Alvarez Pol – Conceptos de estadística 50 TEA (licenciatura) – TEIV (grado)


Estadística básica: nomenclatura

Valor esperado (de una variable aleatoria o de una distribución de probabilidad):


para una variable aleatoria discreta X con valores xi cada uno con probabilidades
xi, el valor esperado, si existe, es: μ=E(X)=∑ pi x i
Para una variable continua X con una función de densidad de probabilidad f(x), el
valor esperado, si existe, es: μ=E(X)=∫ x f (x)dx
Variable aleatoria centrada: una variable aleatoria con valor esperado igual a 0.
Para variables con valor esperado μ, la correspondiente variable central es (X-μ).
Varianza (de una variable aleatoria o de una distribución de probabilidad): el
valor esperado del cuadrado de una variable aleatoria centrada:
σ2 =V (X )=E {[ X−E(X)]2 }
Desviación estándar: raiz cuadrada positiva de la varianza.
Momento central de orden q: en una distribución de una sola variable, es el
valor esperado de la potencia q de la variable aleatoria centrada (X-μ).
E {[ X−μ]q }
Distribución normal o distribución de Laplace-Gaus: distribución de
probabilidad de una variable aleatoria continua X, cuya función de densidad de

[ ( )]
probabilidad es: 2
1 −1 x−μ
f (x)= exp for −∞<x<+∞
σ √2 π 2 σ

H. Alvarez Pol – Conceptos de estadística 51 TEA (licenciatura) – TEIV (grado)


Estadística básica: nomenclatura

Población: la totalidad de los elementos bajo consideración.


Característica: una propiedad que ayuda a identificar o diferenciar entre
elementos de una población dada.
Frecuencia: número de ocurrencias de un tipo dado de evento o de que un
número de observaciones caigan en una categoría convenida.
Distribución de frecuencias: relación empírica (experimental) entre los valores
con una característica y sus frecuencias o sus frecuencias relativas.
Promedio o media aritmética: suma de los valores dividida entre el número de
valores.
Estimador de varianza (de una muestra): medida de la dispersión de n
observaciones xi de media ̄x =(1/n) ∑ x i tomada como la suma de los
cuadrados de las desviaciones sobre su media, dividido por el numero de
observaciones menos 1: 1
s=2

n−1
∑ (xi− ̄x)
2

Estimador de la desviación estándar (de una muestra): raiz positiva del


estimador de la varianza de la muestra.
Estimador del momento central de orden q (de una muestra): para una
distribución de una característica determinada, se corresponde con la media
aritméticade la q-esima potencia de la diferencia entre los valores observados y
su promedio: 1
n
∑ (x i− ̄x )
q

H. Alvarez Pol – Conceptos de estadística 52 TEA (licenciatura) – TEIV (grado)

También podría gustarte