Está en la página 1de 3

Bases para el análisis de datos biométricos

 El cálculo e interpretación de las medidas de posición o medidas de tendencia central


o medidas de resumen: media, mediana, moda, media geométrica.

1- La media.
La media: Se define como la suma de todos los valores observados, dividido por el número total
de observaciones.
Es la medida de posición central más utilizada, la más conocida y la más sencilla de calcular,
debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la
hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus
valores o a los valores extremos demasiado grandes o pequeños.

2- La mediana.
La mediana: Esta medida nos indica que la mitad de los datos se encuentran por debajo de este valor y
la otra mitad por encima del mismo.

Es el valor medio de una secuencia ordenada de datos. Con esta medida podemos identificar el valor
que se encuentra en el centro de los datos, es decir, nos permite conocer el valor que se encuentra
exactamente en la mitad del conjunto de datos después que las observaciones se han ubicado en serie
ordenada.

3- La moda.
La moda o modo: Es el valor de una serie de datos que aparece con más frecuencia. Se obtiene
fácilmente de una clasificación ordenada. A diferencia de la media aritmética, la moda no se ve afectada
por la ocurrencia de los valores extremos.

Ejemplo: Los valores siguientes son las calificaciones de un alumno durante todo el año: 7;  8;  9;  7;  9;
8;  8;  8;  7;  8.

Podemos afirmar entonces que el modo es igual a 8, dado que es el valor que aparece con más
frecuencia.
Media geométrica.
Media geométrica: Se define como la raíz n-ésima del producto de n valores incluidos en un conjunto de
observaciones. Se utiliza con datos de progresiones geométricas para promediar: razones, interés
compuesto e índices. Se calcula mediante la siguiente ecuación:

Dónde:

n: es el tamaño de la muestra.

xi: representa la i-ésima observación dentro del conjunto.

: es la media de la muestra.

Note que en esta ecuación se utiliza el símbolo pi en vez de sigma.

 Calculo e Interpretación de las medidas de dispersión de los datos: rango, varianza,


desviación estándar, percentiles.

1.- Rango: Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más
elevado y el valor más bajo.

2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como
sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de
veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.

La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los
valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos
están.

3- La desviación estándar: Mide la dispersión de una distribución de datos. Entre más dispersa está una
distribución de datos, más grande es su desviación estándar.
Es interesante que la desviación estándar no puede ser negativa. Una desviación estándar cercana a
0000 indica que los datos tienden a estar más cerca a la media. Entre más lejos estén los datos de la
media, más grande es la desviación estándar.

4- Percentiles: Es una medida estadística utilizada para comparar datos. Consiste en un número de 0 a
100 que indica el porcentaje de datos que son igual o menor que determinado valor.

Los percentiles son muy conocidos por su uso en los percentiles de crecimiento. Por ejemplo, si el peso
de un bebé está en el percentil 65, quiere decir que el 65% de los bebés de la misma edad pesan igual o
menos.

Para calcular los percentiles, primero hay que ordenar los datos de forma ascendente. Una vez
ordenados, se resta 0.5 a la posición que ocupa el dato del que queremos calcular el percentil. Después
dividimos entre el número total de datos y multiplicamos por 100.

También podría gustarte