Está en la página 1de 7

Ejercicios de precisión y exactitud de datos

1. Se obtuvieron los siguientes datos al cuantificar el % de acidez del limón fresco en


Chiconcuac, Estado de México.
No. De datos % acidez
1 9.2
2 8.8
3 9
4 9.5
5 8.9
6 9
7 9.4
a) Determinar la precisión de los datos (%CV)
b) Si el valor teórico de % de acidez es 9.2%. ¿Cuál es el % de exactitud de la prueba?
c) Según los resultados los datos presentan exactitud y precisión ¿?

2. Se obtuvieron los siguientes datos al determinar la velocidad de reacción (mol/seg) del


ácido ascórbico con peróxido de hidrogeno.

No datos Velocidad (mol/seg)


1 0.201
2 0.222
3 0.223
4 0.234
5 0.235
6 0.240
7 0.203
8 0.217
9 0.219
10 0.229
11 0.682

a) Determinar la precisión de los datos


b) Según los resultados los datos presentan precisión.
c) Si el valor de %CV es mayor de 3%. Se podría eliminar el dato sospecho por Q
Dixon
Medidas de tendencia central

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor
a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto
de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda. Las
medidas de dispersión en cambio miden el grado de dispersión de los valores de la variable. Dicho
en otros términos las medidas de dispersión pretenden evaluar en qué medida los datos difieren
entre sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten describir un
conjunto de datos entregando información acerca de su posición y su dispersión.

Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la
forma en que se encuentren los datos. Si los datos se encuentran ordenados en una tabla
estadística diremos que se encuentran “agrupados ” y si los datos no están en una tabla
hablaremos de datos “no agrupados”.

Promedio o media

La medida de tendencia central más conocida y utilizada es la media aritmética o promedio


aritmético. Se representa por la letra griega µ cuando se trata del prom edio del universo o
población y por (léase X barra) cuando se trata del promedio de la muestra. Es importante
destacar que µ es una cantidad fija mientras que el promedio de la muestra es variable puesto que
diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La media
se expresa en la misma unidad que los datos originales: centímetros, horas, gramos, etc

Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que ocupa la
posición central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las
observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o
superiores a la mediana.

Si el número de observaciones es par, la mediana corresponde al promedio de los dos valores


centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.

Moda
La moda de una distribución se define como el valor de la variable que más se repite. En un
polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto
del gráfico. Una muestra puede tener más de una moda.
Medidas de dispersión

Las medidas de dispersión entregan información sobre la variación de la variable. Pretenden


resumir en un solo valor la dispersión que tiene un conjunto de datos. Las medidas de dispersión
más utilizadas son: Rango de variación, Varianza, Desviación estándar, Coeficiente de variación.

Desviación estándar ( s muestral)

La desviación estándar, que es la raíz cuadrada de la varianza, se representa por σ (sigma)


cuando pertenece al universo o población y por “s”, cuando pertenece a la muestra. σ² y σ son
parámetros, constantes para una población particular; s 2 y s son estadígrafos, valores que cambian
de muestra en muestra dentro de una misma población. La varianza se expresa en unidades de
variable al cuadrado y la desviación estándar simplemente en unidades de variable.

Es una medida que se utiliza para cuantificar la variación o la dispersión de un conjunto de datos
numéricos.


n=# datos

= media aritmética

Coeficiente de variación %CV. (Precisión de los datos)

Es una medida de la dispersión relativa de los datos. Se define como la desviación estándar de la
muestra expresada como porcentaje de la media muestral.

Es de particular utilidad para comparar la dispersión entre variables con distintas unidades de
medida. Esto porque el coeficiente de variación, a diferencia de la desviación estándar, es
independiente de la unidad de medida de la variable de estudio.

Indica si los datos tienen concordancia entre ellos.

Si él %CV es menor al 3% los datos presenta precisión, para datos no biológicos.

Exactitud en los datos (%E)

El término general "exactitud" se utiliza para describir la cercanía de una medición al verdadero
valor.
Es el cociente entre el error absoluto y el valor que consideramos como exacto (la media). Al igual
que el error absoluto puede ser positivo o negativo porque puede se puede producir por exceso o
por defecto y al contrario que él no viene acompañado de unidades. (Error relativo).

El error absoluto puede ser un valor positivo o negativo, según si la medida es superior al valor real
o inferior y además tiene las mismas unidades que las de la medida.

| |

Donde:

Si el %E es menor al 3% los datos si presentan precisión.


Distribución Normal
En estadística y probabilidad se llama distribución normal, distribución de Gauss, distribución
gaussiana o distribución de Laplace-Gauss, a una de las distribuciones de probabilidad de variable
continua que con más frecuencia aparece en estadística y en la teoría de probabilidades.
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un
determinado parámetro estadístico. Esta curva se conoce como campana de Gauss y es el gráfico
de una función gaussiana.
La importancia de esta distribución radica en que permite modelar numerosos fenómenos
naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de
este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que
en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación
se obtiene como la suma de unas pocas causas independientes.
De hecho, la estadística descriptiva solo permite describir un fenómeno, sin explicación alguna.
Para la explicación causal es preciso el diseño experimental, de ahí que al uso de la estadística en
psicología y sociología sea conocido como método correlacional.
La distribución normal también es importante por su relación con la estimación por mínimos
cuadrados, uno de los métodos de estimación más simples y antiguos.
La distribución normal también aparece en muchas áreas de la propia estadística. Por ejemplo,
la distribución muestral de las medias muestrales es aproximadamente normal, cuando la
distribución de la población de la cual se extrae la muestra no es normal
Contrasté de Dixon o contraste “Q”

Se utiliza este criterio cuando en los datos obtenidos existe algún dato atípico y para descartar
estadísticamente ese dato se realiza una prueba de contraste (Q de Dixon) con la hipótesis
nula de que el valor atípico pertenece al conjunto de datos.

Puede utilizarse para rechazar una medida de una población de 3 a 30 medidas de una
cantidad, a cualquier nivel de confianza, aunque generalmente se utiliza el nivel del 95%; es
decir, si se rechaza una medida según este criterio, se hace con una confianza del 95%. Para
aplicar el criterio Q, se ordenan las medidas en orden creciente, tomándose los valores más
divergentes, superior e inferior de la tabla.

El valor se se obtiene a partir del nivel de confianza que se desee evaluar la prueba y el
tamaño de muestra.

Si en valor la hipótesis nula se descarta, por lo tanto el valor atípico no


pertenece al conjunto de datos.

Si en valor la hipótesis nula se acepta, por lo tanto el valor atípico si pertenece


al conjunto de datos.
Ejemplo:
Calcular la precisión y exactitud de la edad del grupo de alumnos de LCB I 2103
Para la % exactitud se tomara el cómo valor real 19 años
Edad del grupo
No. Edad
1 19
2 18
3 19
4 18
5 19
6 18
7 19
8 18
9 18
10 19
11 18
12 20
13 19
14 42 se elimina por Q dixon

n= 14
Promedio 20.2857143
S= 6.28096724
%CV= 30.9625146
%E= 6.76691729 6.7669

NOTA: si el % CV es mayor al 3% eliminar el dato sospechoso por Q de Dixon

Ho: Valor sospechoso si pertenece a la población

Qexp= 0.91666667

Qtab = 0.384
Qexp=0.9966 > Qtab=0.384

Ho se rechaza por lo tanto el valor sospechoso no pertenece al conjunto de datos


Se vuelve a calcular
precisión y exactitud de la
prueba

No. Edad
1 19
2 18 Promedio= 18.6153846
3 19 s= 0.65044364
4 18 %CV= 3.4941187
5 19 %E= 2.0242915
6 18
7 19
8 18
9 18
10 19
11 18
12 20
13 19

También podría gustarte